約 6,678,966 件
https://w.atwiki.jp/ddwrt_openwrt/pages/33.html
色々前準備を整えてきましたが、ようやくIPSec VPNのの設定に入ります。 参考情報 この記事を書くにあたって引き続き以下の情報を参考にしています OpenWRTの公式サイトのDocument 『install/configure strongswan for IPhone/IPad』 StrongSwan公式サイトのDocument 『iOS (Apple iPhone, iPad...) and Mac OS X』 編集方法 SSHでCLIログインしてviで編集します。 OpenWrtのvi は初期インストールのBusybox版・追加可能なvim 7.0ともに デフォルトで autoindent が有効になっているため、 Terminalからcopy and paste で貼付けすると、自動インデント機能により桁ががずれてしまします。 こんな風に。 1行名 2行名 3行目 4行名 自動インデント機能を抑止するため、[ESC]押した後のコマンドモードから 「 」を押し、続けて「set noautoindent」または省略形の「set noai」を実行してください。 set noautoindent なお、viの現在の設定は「 set」で確認できます。 /etc/ipsec.conf の作成 IPSecの動作を ipsec.conf に記述します。端末種類ごとにセクションを分けて記述できます。 各パラメータの詳細はStrongSwan公式ドキュメントを参照してください。 vi /etc/ipsec.conf 共通部分 config setup conn %default left=%any leftsubnet=0.0.0.0/0 leftfirewall=yes leftcert=serverCert.pem right=%any rightsubnet=192.168.1.0/24 rightsourceip=%dhcp leftsubnet=0.0.0.0/0 の箇所はインターネット側のアドレスになります。この例では どんなIPでも受け付けます。(このためLAN内からでもIPSec接続できてしまいます。) rightsubnet=192.168.1.0/24 の箇所はOpenWRTのLAN側IPアドレスのNWセグメントを指定してください。 Apple iOS対応部分 以下を ipsec.conf に追記します。 conn ios keyexchange=ikev1 authby=xauthrsasig xauth=server rightcert=iPhoneCert.pem forceencaps=yes auto=add /etc/ipsec.secrets の設定 IPSec接続後のユーザ認証用のIDとパスワードを設定します。 各パラメータの詳細はStrongSwan公式ドキュメントを参照してください。 # vi /etc/ipsec.secrets # /etc/ipsec.secrets - strongSwan IPsec secrets file RSA serverKey.pem iPhone_user XAUTH "iPhone_password" OpenWrtルータ用のServer証明書「serverKey.pem」を指定しています。 次の行からはIPSec 接続時に使用するユーザ名とパスワードを指定します。 ユーザ名とパスワードは任意です。 /etc/strongswan.conf の設定 strongswa.conf を設定します。 # vi /etc/strongswan.conf 各パラメータの詳細はStrongSwan公式ドキュメントを参照してください。 # strongswan.conf - strongSwan configuration file charon { dns1 = 192.168.1.1 #dns1 = 8.8.8.8 #dns2 = 8.8.8.4 #dns1にルータのIPを指定してダメだったらgoogleのDNSを指定してみましょう。 threads = 16 plugins { dhcp { server = 192.168.1.1 } } } pluto { } libstrongswan { # set to no, the DH exponent size is optimized # dh_exponent_ansi_x9_42 = no } dns1 と dhcp は実際の環境に合わせて適切なIPを設定してください。 ここではDNSもDHCPサーバもOpenWrtルータ 192.168.1.1 (初期値) を指定しています。 /etc/init.d/ipsecの作成 何故かStrongSwan用の自動起動スクリプトが用意されていないので、新規に作成します。 以下を /etc/init.d/ 以下に ipsec として保存します。 #!/bin/sh /etc/rc.common # ipsec init script START=46 STOP=01 start() { ipsec start } stop() { ipsec stop } restart() { ipsec restart } reload() { ipsec update } 保存したら、スクリプトに実行権限をつけておきます。 # chmod 755 /etc/init.d/ipsec strongswan daemon の起動確認 ここまで出来たら、CLI上でstrongswan のdaemonを起動してみます。 # /etc/init.d/ipsec start 設定ファイルに不備がなければ以下のメッセージがコンソールに表示されます。 Starting strongSwan 5.0.0 IPsec [starter]... WebUI上での確認と自動起動設定 LuCIのWebUIで 『ipsec』が管理できるかどうかを確認します。 「System」タブ→「Startup」タブを開いて Start priority 46番(/etc/init.d/ipsec のSTARTで設定した値)に ipsec の行が追加されていることを確認します。 最初は Enable/Disable が Disableになっているはずなので、自動起動できるように ボタンをクリックして Enabled にします。
https://w.atwiki.jp/musiki/pages/313.html
Down Low Convextionは、アメリカのテキサス州出身であるGerard Hanson(1972年生)によるソロユニット。名前の由来はこちら。 1994年、Dan Kurziusとともに"Hardsync"という雑誌を創刊した。電子音楽作品のレビューやミュージシャンらへのインタビューなどを主体に活動していたが、2年後にコンピューターがブチ壊れたので活動停止となった。 1995年、Convextion名義で"Convextion"をリリース。2年後の1997年にも"Convextion 2"と"Untitled"を発売した。 1997年、Derrick MayのMix-Up Vol.5に"Convextion"が使用された。 2006年ようやく1stアルバム"Convextion"をリリース。 寡作である理由は報酬未払い関係。 Photo by jacobarnold Sample(Spice Tea)
https://w.atwiki.jp/0x0b/pages/70.html
型(Type) 値は実体であり、9 つの型のうちの 1 つを取る。型は 9 つ (Undefined, Null, Boolean, String, Number, Object, Reference, List, Completion) ある。Reference 型, List 型, Completion 型の値は式評価の中間結果としてのみ使われ、オブジェクトのプロパティに蓄積はできない。 Undefined 型 (Undefined Type) Undefined 型は、undefined と呼ばれる厳密には一つの値を持つ。値を代入されていない任意の変数は undefined 値を持つ。 Null 型 (Null Type) Null 型は、null と呼ばれる厳密には一つの値を持つ。 Boolean 型 (Boolean Type) Boolean 型は、true と false と呼ばれる二値を持つ論理的実体をあらわす。 String 型 (String Type) String 型は、0 または 16 ビット符号なし整数値("要素")の、すべての有限な序列のあるシーケンスの組である。ECMAScript プログラムの実行時、String 型は一般にテキストデータの表現に使われる。その中で、文字列内の各要素はコードポイント値(ソーステキスト)として扱われる。シーケンス内で各要素は位置の占有とみなされる。これらの位置は正の整数でインデックス付けられる。最初の要素が位置 0 で、次の要素は位置 1 であり、以下同様である。文字列の長さは、その中にある要素の数である。空文字列は要素を持たず、長さは 0 である。 文字列が実際のテキストデータを含むとき、各要素は1個の UTF-16 単位として考えられる。これが実際に蓄積された String の形式かどうかに関係なく、String 内部の文字は UTF-16 であらわされたかのように番号付けられる。String 上の全操作は、それらを区別しない 16 ビット符号無し整数の列として扱う; それらは結果の文字列が正規化形式であることを保証しないし、language-sensitive な結果であることも保証しない。 NOTE これらの決定の理論的解釈は単純さとしての文字列と可能性としての高パフォーマンス性の実装を保持することであった。外部から実行環境に入るテキストデータ (ユーザの入力、ファイルやネットワークからの受信などからのテキスト読み込み等) が、実行プログラムがそれを見る前に Unicode 正規化形式 C (Unicode Normarized Form C) に変換されることを意図する。通例これは、入ってくるテキストが元の文字エンコーディングから Unicode に変換されることを同時に発生させる。ECMAScript ソースコードが正規化形式 C であることが勧められるので、それらが Unicode エスケープシーケンスを含んでいない限り、文字列リテラルは正規化されていること(ソーステキストが正規化されることを保証される場合)を保証される。 Number 型 (Number Type) Number 型は、ちょうど 18437736874454810627 (即ち 264-253+3) 個の値を持ち、二進法浮動小数点数点演算のための IEEE 標準に定められる倍精度64ビットのフォーマットIEEE 754 の値を表わす。ただし IEEE 標準の 9007199254740990 (すなわち 253-2) 個の区別される "Not-a-Number" 値は ECMAScript においては単独の特殊な NaN 値として表されることを除く。(プログラム実行によりグローバルに定義された変数 NaN が変更されていないと仮定して、NaN 値がプログラム式 NaN によって生成されることに注意。) 外部コードが様々な Non-a-Number 間の違いを判定できる実装もあるだろうが、その振舞いは実装依存である; ECMAScriptコードでは、NaN 値はすべて互いと判別不能である。 他に特別な値が 2 つある。それは正の無限 (positive Infinity) 、および負の無限 (negative Infinity) と呼ばれる。簡単に、解説ではシンボル +∞ と -∞ によってもこれらの値をそれぞれ参照する。(グローバルに定義された変数 Infinity がプログラム実行によって変更されてないと仮定して、これら 2 つの無限数値がプログラム式 +Infinity (あるいは単に Infinity) および -Infinity によって生成されることに注意しなさい。) 残りの 18437736874454810624 (すなわち 264-253) 個の値は有限数と呼ばれる。これらの半分は正の数、半分は負の数である; 有限の正の数のそれぞれについて、同じ大きさを持つ対応する負の数がある。 正の 0 と負の 0 の双方があることに注意。簡単に、解説ではシンボル +0 及び -0 によってもこれらの値をそれぞれ参照する。(これら 2 つの 0 数値はプログラム式 +0 (または単に 0) および -0 によって提示される。) 18437736874454810622 (つまり 264-253-2) 個の 0 でない有限の値は 2 種類ある それらのうち 18428729675200069632 (つまり 264-254) 個は次の形式で正規化される。 s × m × 2e s は +1 または -1 、 m は 252 以上 253 未満の正の整数、e は -1074 以上 971 以下の範囲の整数である。 残りの 9007199254740990 (つまり 253-2) 個の値は次の形式で非正規化 (denormalised) される。 s × m × 2e s は +1 または -1 、 m は 252 未満の正の整数、e は -1074 である。 大きさが 253 以下の正負の整数全ては Number 型で表現できることに注意(実に、整数 0 は 2 つの表現 +0 と -0 を持つ)。 有限数はそれが 0 でなく (上の 2 つのどちらかの式で) 使われた整数 m が奇数のとき、有効数字は奇数である。そうでなければ、有効数字は偶数である。 本仕様において、正確な 0 以外の実際の数学的な量(それはさらに π のような無理数かもしれない) を x と表わすとき、句 " x の数値" は、次の方法で選ばれた数値を意味する。Number 型のすべての有限の値の集合を考える。 -0 を除外し、 Number 型では表現不能な 2 つの値、すなわち 21024(即ち +1 × 253 × 2971) 及び -21024(即ち -1 × 253 × 2971) を追加する。この集合から x の値に最も近いものを選ぶ。最も近いものが集合内の 2 個ある場合、有効数字が偶数であるもの選ばれる; この用途について、拡張した 2 つの値 21024、そして-21024 は有効数字が偶数とみなす。最後に、21024 が選ばれた場合、それを +∞ に置換する; -21024 が選ばれた場合、それを -∞ に置換する; +0 が選ばれた場合、 x が 0 未満である場合のみそれを -0 に置換する; 他の値が選ばれたら変更はない。この結果が x の数値である。(この過程は、 IEEE 754 "round to nearest" モードの振舞いに正確に該当する。) 231 以上 231-1 以下、また 0 以上 232-1 以下の範囲の整数のみを扱う ECMAScript 演算子もある。これらの演算子は任意の Number 型の値を受け付けるが、まず最初に 232 個の整数値の一つに変換を行う。それぞれ型変換 ToInt32 (Signed 32 Bit Integer), ToUint32 (Unsigned 32 Bit Integer) にある ToInt32 及び ToUint32 演算子の解説を参照。 Object 型 (Object type) Object とはプロパティの序列のない集合体である。各プロパティは名前と値、そして属性の組で構成される。 プロパティ属性 プロパティは次の組から0個以上の属性を持つことができる |属性説明 ReadOnly 属性|このプロパティは読出し専用のプロパティである。 ECMAScript コードによるこのプロパティの書きこみ試行は無視される。 (注意 実装によって行われるアクションのために ReadOnly 属性のプロパティの値が変更されるケースもありうる; "ReadOnly" であることは "定数で変更されない" ということではない)| DontEnum 属性 このプロパティは for-in ループ (文 for文) では列挙されない。 DontDelete 属性 このプロパティの削除を試行しても無視される。 delete 演算子の説明(式 delete 演算子) を参照。 Internal 属性 内部プロパティは名前を持たず、プロパティアクセス演算子経由で直にアクセスできない。 これらのプロパティへのアクセス方法は実装依存である。 言語仕様毎に、使われ方やタイミングによって特定されるプロパティもある。 内部プロパティとメソッド 内部プロパティとメソッドは言語内には露出しない。この文書の目的のために、 ここでは二重角括弧 で囲ってその名前をあらわす。 アルゴリズムがオブジェクトの内部プロパティを使用していて、 指示された内部プロパティをオブジェクトが実装していないとき、ランタイムエラーが発生する。 露出するプロパティのアクセスには 2 種類ある get と put、取得と設定に相当する。 Native ECMAScript オブジェクトは Prototype と呼ばれる内部プロパティを持つ。 このプロパティの値は null や オブジェクトであり、継承の実装に使用される。 Prototype オブジェクトのプロパティは、 子オブジェクトのプロパティの取得には露出するが、設定には露出しない。 次の表はこの仕様で使われる内部プロパティの概要である。 説明は Native ECMAScript オブジェクトのためのそれらの挙動を示す。 Host オブジェクトはこれらの内部メソッドを任意の実装依存の挙動に実装してもよく、また Host オブジェクトは内部メソッドの一部のみを実装して他を実装しなくてもよい。 プロパティ パラメータ 説明 Prototype 無し このオブジェクトのプロトタイプ。 Class 無し このオブジェクトの種類。 Value 無し このオブジェクトに関する内部状態の情報。 Get (プロパティ名) プロパティの値を返す。 Put (プロパティ名, 値) 指定されたプロパティに値を設定する。 CanPut (プロパティ名) 指定されたプロパティ名の Put 操作が成功するかどうかを示す boolean 値を返す。 HasProperty (プロパティ名) オブジェクトがすでに与えられた名前のメンバを持っているかを示す boolean 値を返す。 Delete (プロパティ名) オブジェクトから指定されたプロパティを取り除く。 DefaultValue (ヒント) オブジェクトのデフォルト値を返すが それは primitive 値でなければならず、オブジェクトや参照であってはならない。 Construct 呼出側が提供する引数値のリスト オブジェクトを生成する。new 演算子によって呼出される。 この内部メソッドを実装するオブジェクトはコンストラクタ (constructor) と呼ばれる。 Call 呼出側が提供する引数値のリスト オブジェクトに関連するコードを実行する。 関数呼出の式 (expression) を経由して呼出される。 この内部メソッドを実装するオブジェクトは関数 (function) と呼ばれる。 HasInstance (値) 値がこのオブジェクトに振る舞いを委任しているかどうかを示す Boolean 値を返す。 Native ECMAScript オブジェクトでは、Function オブジェクトだけが Hasinstance を実装している。 Scope 無し その中で Function オブジェクトが実行される環境を定義するスコープ連鎖。 Match (文字列, インデックス) 正規表現マッチを試行し、 MatchResult 値を返す(正規表現 表記法)。 各オブジェクトは Class プロパティと、Get, Put, HasProperty, Delete, DefaultValue メソッドを実装しなければならない。Host オブジェクトであっても同様である。(注意 とはいえ、DefaultValue メソッドは、単にランタイムエラーを生成してもよい。 Prototype プロパティの値はオブジェクトか null でなければならず、 各 Prototype 連鎖の長さは有限でなければならない(つまり、任意のオブジェクトから始まる Prototype プロパティの再帰的アクセスは、結果的に null 値に導かれる)。 Native オブジェクトが Host オブジェクトを Prototype として持つかどうかは実装に依存する。 各種組込み オブジェクトの Class プロパティの値はこの仕様で定義される。 Host オブジェクトの Class プロパティの値は任意の値でよく、組込み オブジェクトからその Class プロパティのために使用される値でも例外ではない。 この仕様はプログラムに Class プロパティの値へのアクセスを意味するものは何も提供しないことに注意; これは組込み オブジェクトの種類の違いの区別に内部的に使用される。 各 Native オブジェクトは、セクション Get (P), Put (P, V), CanPut (P), HasProperty (P), Delete (P)で述べられる Get, Put, CanPut, HasProperty, Delete メソッドをそれぞれ実装する。但し Array オブジェクトの Put メソッドの実装はわずかに異なる(Arrayオブジェクト Put (P, V))。 Host オブジェクトは任意の方法でこれらのメソッドを実装してよい; 例えば、特殊な Host オブジェクトの Get 及び Put が、プロパティに値を格納するが HasProperty は常に false を生成する可能性がある。 次のアルゴリズム説明において、 O を Native ECMAScript オブジェクト、P を文字列と仮定する。 [Get]] (P) O の Get メソッドがプロパティ名 P で呼出されると、次のステップがとられる O が P という名前のプロパティを持っていなければ、ステップ 4 へ進む。 そのプロパティの値を取得する。 Result(2) を返す。 O の Prototype が null ならば、undefined を返す。 Prototype の Get メソッドを、プロパティ名 P で呼び出す。 Result(5) を返す。 Put (P, V) O の Put メソッドがプロパティ P と値 V で呼び出された場合、次のステップがとられる O の CanPut メソッドを、名前 P で呼び出す。 Result(1) が false なら戻る。 O が名前 P のプロパティを持っていなければ、ステップ 6 へ進む。 そのプロパティの値に V を設定する。プロパティの属性は変更されない。 戻る。 名前 P のプロパティを生成し、その値に V を設定し、空の属性を与える。 戻る。 しかし、O が Array オブジェクトである場合、より入念な Put メソッド(Arrayオブジェクト Put (P, V))を持つ。 CanPut (P) CanPut メソッドは Put メソッドによってのみ使用される。O の CanPut メソッドがプロパティ P で呼出されると、次のステップが取られる O が名前 P のプロパティを持っていなければ、ステップ 4 へ進む。 プロパティが ReadOnly 属性を持っていれば、 false を返す。 true を返す。 O の Prototype が null ならば、true を返す。 O の Prototype の Canput メソッドを、プロパティ名 P で呼出す。 Result(5) を返す。 HasProperty (P) O の HasProperty メソッド がプロパティ名 P で呼出されると、次のステップが取られる O が名前 P のプロパティを持っていれば、 true を返す。 O の Prototype が null ならば、 false を返す。 Prototype の HasProperty メソッドをプロパティ名 P で呼出す。 Result(3) を返す。 Delete (P) O の Delete メソッドがプロパティ名 P で呼出されると、次のステップが取られる O が名前 P のプロパティを持たなければ、 true を返す。 そのプロパティが DontDelete 属性であれば、 false を返す。 O から名前 P のプロパティを取り除く。 true を返す。 DefaultValue (hint) O の DefaultValue メソッドがヒント String で呼出されると、次のステップが取られる O の Get メソッドを、引数 "toString" で呼出す。 Result(1) がオブジェクトでなければ、ステップ 5 へ。 Result(1) の Call メソッドを、this 値 O と空の引数のリストで呼出す。 Result(3) がプリミティブ値であれば、Result(3) を返す。 O の Get メソッドを、引数 "valueOf" で呼出す。 Result(5) がオブジェクトでなければ、ステップ 9 へ。 Result(5) の Call メソッドを、this 値 O と空の引数のリストで呼出す。 Result(7) がプリミティブ値であれば、 Result(7) を返す。 例外 TypeError を投げる。 O の DefaultValue メソッドがヒント Number で呼出されると、次のステップが取られる O の Get メソッドを、引数 "valueOf" で呼出す。 Result(1) がオブジェクトでなければ、ステップ 5 へ。 Result(1) の Call メソッドを、this 値 O と空の引数のリストで呼出す。 Result(3) がプリミティブ値であれば、Result(3) を返す。 O の Get メソッドを、引数 "toString" で呼出す。 Result(5) がオブジェクトでなければ、ステップ 9 へ。 Result(5) の Call メソッドを、this 値 O と空の引数のリストで呼出す。 Result(7) がプリミティブ値であれば、 Result(7) を返す。 例外 TypeError を投げる。 O の DefaultValue メソッドがヒント無しで呼出されると、ヒントが Number であるかのように振舞う。O が Date オブジェクト (Dateオブジェクト)の場合は、ヒントが String であるかのように振舞う。 Native オブジェクトのための上記 DefaultValue 仕様はプリミティブな値のみを返す。Host オブジェクトがそれ自身の DefaultValue メソッドを実装するならば、その DefaultValue メソッドはプリミティブな値のみを返すことを保証しなければならない。 Reference 型 内部 Reference 型は言語のデータ型ではない。 純粋に解説上の目的で本仕様に定義される。 ECMAScript 実装は、ここに述べるように、リファレンス上にそれが生成し演算したかのように振舞わなければならない。しかしながら、Reference 型の値は、式評価の中間結果としてのみ用いられ、変数あるいはプロパティの値として格納することはできない。 Reference 型は、delete, typeof のような演算子、そして代入演算子の振舞いの説明に使用される。例えば、代入の左オペランドはリファレンスの生成が期待される。代入の振舞いは、代わりに、代入演算子の左オペランドの構文形式上のケース解析の点から完全に説明される、ある難点が無ければ 関数呼び出しはリファレンスを返すことを許される。純粋に Host オブジェクトにこの可能性が認められる。本仕様で定義される組込み ECMAScript 関数はリファレンスを返さず、リファレンスを返すようなユーザ定義関数に提供するものは無い。(構文的ケース解析を使用しないもう一つの理由は、冗長で扱いにくく仕様の多くの部分に影響するだろうということだ。) Reference 型のもう一つの利用は、関数呼出しの this 値の決定の説明である。 Reference は、オブジェクトのプロパティへの参照である。Reference は基準オブジェクト(base object) とプロパティ名の 2 つの成分から構成される。 Reference の成分にアクセスするために、本仕様において次の抽象的演算が使用される GetBase(V). リファレンス V の基準オブジェクト成分を返す。 GetPropertyName(V). リファレンス V のプロパティ名成分を返す。 リファレンス上の演算において、本仕様では次の抽象的演算が使用される GetValue (V) Type(V) が Reference でなければ、 V を返す。 GetBase(V) を呼出す。 Result(2) が null ならば、例外 ReferenceError を投げる。 Result(2) の Get メソッドを呼び、プロパティ名に GetPropertyName(V) を渡す。 Result(4) を返す。 PutValue (V, W) Type(V) が Reference でなければ、例外 ReferenceError を投げる。 GetBase(V) を呼出す。 Result(2) が null ならば、ステップ 6 へ。 Result(2) の Put メソッドを呼び、プロパティ名に GetPropertyValue(V)、値に W を渡す。 戻る。 Global オブジェクトの Put メソッドを呼び、プロパティ名に GetPropertyValue(V)、値に W を渡す。 戻る。 List 型 内部 List 型は言語のデータ型ではない。純粋に解説上の目的で本仕様に定義される。ここに記述された方法で List 値上で提示し演算したかのように、ECMAScript 実装は振舞わなければならない。しかしながら、Reference 型の値は、式評価の中間結果としてのみ用いられ、変数あるいはプロパティの値として格納することはできない。 List 型は、new 式 (new expressions) および関数呼び出し (function call) において、引数リストの評価を説明するのに使用される。List 型の値は、単純な順序のある値のシーケンスである。シーケンスは任意の長さでよい。 Completion 型 内部 Completion 型は言語のデータ型ではない。純粋に説明を目的として本仕様に定義される。ここに記述された方法で Completion 値上で提示し演算したかのように、ECMAScript 実装は振舞わなければならない。とはいえ、Completion 型の値は、文(statment) 評価の中間結果として利用されるのみであり、変数やプロパティの値として蓄積することはできない。 Completion 型は制御の非ローカル転送を実行する文(statement; break, continue, return, throw) の挙動の説明に使用される。Completion 型の値は形式 (type, value, target) の 3 成分であり、type は normal, break, continue, return, throw のうちの一つ、value は任意の ECMAScript 値または empty、target は任意の ECMAScript 識別子または empty である。 用語 "中途完了 (abrupt completion)" は type が normal 以外である任意の completion を参照する。 型変換(Type Conversion) Cast 明示的な型変換 ECMAScript ランタイムシステムは、必要時に自動型変換を行う。一定の構成物の意味論を計画にするため、変換演算子のセットの定義が有用である。これらの演算子は言語の一部ではない; ここでは、言語の意味論の仕様を助けるためにこれらを定義する。変換演算子は多様的である; つまり、標準的な型を受け入れることはできるが、 Reference, List, Completion (内部的型) を受け入れることはできない。 ToPrimitive ToPrimitive 演算子は引数 Value と選択的な引数 PreferredType をとる。 ToPrimitive 演算子はその引数の値を非 Object 型に変換する。オブジェクトが一つ以上のプリミティブ型に変換可能である場合、選択的な PreferredType ヒントをそのタイプに選んでよい。変換は次の表にしたがって発生する 入力型 結果 Undefined 結果は入力引数と等しい。(無変換) Null 結果は入力引数と等しい。(無変換) Boolean 結果は入力引数と等しい。(無変換) Number 結果は入力引数と等しい。(無変換) String 結果は入力引数と等しい。(無変換) Object Object のデフォルトの値を返す。オブジェクトのデフォルトの値は、オブジェクトの内部メソッド DefaultValue に選択的ヒント PreferredType を渡して取得される。DefalutValue メソッドの挙動は、全ての ECMAScript オブジェクトの仕様によって定義される。(型 内部プロパティとメソッド DefaultValue(Hint)) ToBoolean ToBoolean 演算子は、次の表にしたがって引数を Boolean 型の値に変換する。 入力型 結果 Undefined false Null false Boolean 結果は入力引数と等しい。(無変換) Number 引数が +0, -0, NaN ならば結果は false; そうでなければ true String 引数が空文字列 (長さ 0) ならば結果は false; そうでなければ true Object true ToNumber ToNumber 演算子は、次の表にしたがって引数を Number 型の値に変換する。 入力型 結果 Undefined NaN Null +0 Boolean 引数が true ならば結果は 1.false ならば +0。 Number 結果は入力引数と等しい。(無変換) String 下の文法と注意を参照。 Object 次のステップを適用 1. ToPrimitive(input argument, hint Number) を呼出す。 2. ToNumber(Result(1)) を呼出す。 3. Result(2) を返す。 String 型に適用される ToNumber (ToNumber Applied to the String Type) 文字列に適用される ToNumber は、入力文字列に 次の文法を適用する。文法が文字列を StringNumericLiteral として解釈不能ならば、 ToNumber の結果は NaN である。 StringNumericLiteral StrWhiteSpaceopt StrWhiteSpaceopt StrNumericLiteral StrWhiteSpaceopt StrWhiteSpace StrWhiteSpaceChar StrWhiteSpaceopt StrWhiteSpaceChar TAB SP NBSP FF VT CR LF LS PS USP StrNumericLiteral StrDecimalLiteral HexIntegerLiteral StrDecimalLiteral StrUnsignedDecimalLiteral StrUnsignedDecimalLiteral StrUnsignedDecimalLiteral StrUnsignedDecimalLiteral Infinity DecimalDigits . DecimalDigitsopt ExponentPartopt . DecimalDigits ExponentPartopt DecimalDigits ExponentPartopt DecimalDigits DecimalDigit DecimalDigits DecimalDigit DecimalDigit one of 0 1 2 3 4 5 6 7 8 9 ExponentPart ExponentIndicator SignedInteger ExponentIndicator one of e E SignedInteger DecimalDigits DecimalDigits DecimalDigits HexIntegerLiteral 0x HexDigit 0X HexDigit HexIntegerLiteral HexDigit HexDigit one of 0 1 2 3 4 5 6 7 8 9 a b c d e f A B C D E F StringNumericLiteral と NumericLiteral の構文間にいくつか注目すべき相違点がある (字句について 数値リテラル) StringNumericLiteral には、空白または行終端子が、先行また後続してよい。 10 進数である StringNumericLiteral は may have any number of leading 0 digits. 10 進数である StringNumericLiteral は、符号を示す + または - が先行してよい。 空や空白である StringNumericLiteral は +0 に変換される。 文字列の数値への変換は、全体に数値リテラルの数値の決定と似ている(字句について 数値リテラル)が、いくつかの点で異なり、従って string numeric literal の Number 型の値への変換処理はここに全て与えられる。この値は 2 ステップで決定される まず、数学値 (MV) が string numeric literal から派生する; 次に、この数学値が次のように丸められる。 StringNumericLiteral [empty] の数学値は、 0 である。 StringNumericLiteral StrWhiteSpace の数学値は、 0 である。 StringNumericLiteral StrWhiteSpaceopt StrNumericLiteral StrWhiteSpaceopt の数学値は、空白が存在するかどうかにかかわらず、 StrNumericLiteral の数学値である。 StrNumericLiteral StrDecimalLiteral の数学値は、 StrDecimalLiteral の数学値である。 StrNumericLiteral HexIntegerLiteral の数学値は、 HexIntegerLiteral の数学値である。 StrDecimalLiteral StrUnsignedDecimalLiteral の数学値は、 StrUnsignedDecimalLiteral の数学値である。 StrDecimalLiteral + StrUnsignedDecimalLiteral の数学値は、 StrUnsignedDecimalLiteral の数学値である。 StrDecimalLiteral - StrUnsignedDecimalLiteral の数学値は、 負の StrUnsignedDecimalLiteral の数学値である。 (StrUnsignedDecimalLiteral の数学値が 0 ならば、負の数学値も 0 であることに注意。下に述べる丸め規則は handles the conversion of this sign less mathematical zero to a floating-point +0 or -0 as appropriate ) StrUnsignedDecimalLiteral Infinity の数学値は、 1010000 (a value so large that it will round to +∞) である。 StrUnsignedDecimalLiteral DecimalDigits. の数学値は、 DecimalDigits の数学値である。 StrUnsignedDecimalLiteral DecimalDigits. DecimalDigits の数学値は、 n を 2 つ目の DecimalDigits の文字数として、 1 つ目の DecimalDigits の数学値に (2 つ目の DecimalDigits の数学値 × 10-n) を足す。 StrUnsignedDecimalLiteral DecimalDigits. ExponentPart の数学値は、 e を ExponentPart の数学値として、 DecimalDigits の数学値 × 10e である。 StrUnsignedDecimalLiteral DecimalDigits. DecimalDigits ExponentPart の数学値は、 n を 2 つ目の DecimalDigits の文字数、 e を ExponentPart の数学値として、 (1 つ目の DecimalDigits の数学値 + (2 つ目の DecimalDigits の数学値 × 10n) ) × 10e である。 StrUnsignedDecimalLiteral . DecimalDigits の数学値は、 n を DecimalDigits の文字数として、 DecimalDigits の数学値 × 10n である。 StrUnsignedDecimalLiteral . DecimalDigits ExponentPart の数学値は、n を DecimalDigits の文字数、 e を ExponentPart の数学値として、 DecimalDigits の数学値 × 10e-n である。 StrUnsignedDecimalLiteral DecimalDigits の数学値は、 DecimalDigits の数学値である。 StrUnsignedDecimalLiteral DecimalDigits ExponentPart の数学値は、e を ExponentPart の数学値として、 DecimalDigits の数学値 × 10e である。 DecimalDigits DecimalDigit の数学値は、 DecimalDigit の数学値である。 DecimalDigits DecimalDigits DecimalDigit の数学値は、 (DecimalDigits の数学値 × 10) + DecimalDigit の数学値 である。 ExponentPart ExponentIndicator SignedInteger の数学値は、 SignedInteger の数学値である。 SignedInteger DecimalDigits の数学値は、 DecimalDigits の数学値である。 SignedInteger + DecimalDigits の数学値は、 DecimalDigits の数学値である。 SignedInteger - DecimalDigits の数学値は、負の DecimalDigits の数学値である。 DecimalDigit 0 または HexDigit 0 の数学値は、 0 である。 DecimalDigit 1 または HexDigit 1 の数学値は、 1 である。 DecimalDigit 2 または HexDigit 2 の数学値は、 2 である。 DecimalDigit 3 または HexDigit 3 の数学値は、 3 である。 DecimalDigit 4 または HexDigit 4 の数学値は、 4 である。 DecimalDigit 5 または HexDigit 5 の数学値は、 5 である。 DecimalDigit 6 または HexDigit 6 の数学値は、 6 である。 DecimalDigit 7 または HexDigit 7 の数学値は、 7 である。 DecimalDigit 8 または HexDigit 8 の数学値は、 8 である。 DecimalDigit 9 または HexDigit 9 の数学値は、 9 である。 HexDigit a または HexDigit A の数学値は、 10 である。 HexDigit b または HexDigit B の数学値は、 11 である。 HexDigit c または HexDigit C の数学値は、 12 である。 HexDigit d または HexDigit D の数学値は、 13 である。 HexDigit e または HexDigit E の数学値は、 14 である。 HexDigit f または HexDigit F の数学値は、 15 である。 HexIntegerLiteral 0x HexDigit の数学値は、 HexDigit の数学値である。 HexIntegerLiteral 0X HexDigit の数学値は、 HexDigit の数学値である。 HexIntegerLiteral HexIntegerLiteral HexDigit の数学値は、 (HexIntegerLiteral の数学値 × 16) + HexDigit の数学値 である。 一旦数値文字列リテラルの厳密な数学値が決定されたら、 Number 型の値に丸められる。数学値が 0 ならば、丸められる値は、数値文字列リテラル内の最初の非空白文字が - でなければ +0 であり、 - ならば -0 である。 そうではなく、リテラルが StrUnsignedDecimalLiteral を含まず、そのリテラルが 20 を超える有効数字数\でなければ、数値が 20 番目以降の各有効数字を数字 0 で置換して生成されるリテラルの数学値の数値、または 20 番目以降の各有効数字を数字 0 で置換して生成されるリテラルの数学値の数値、そして 20 番目の数字の位置でリテラルを増加のどちらかでありえる場合、丸められる値は(型 Number型で定義される意味の) 数学値の数値でなければならない。数字はそれが ExponentPart の一部\でなく次の二点のどちらかあれば有効数字 (significant) である。 0 でない。 その左側が 0 以外の数字でその右側が 0 以外の数字で ExponentPart 内でない。 ToInteger ToInteger 演算子は引数を整数値に変換する。この演算子は次のように機能する 入力引数に ToNumber を呼出す。 Result(1) が NaN ならば、 +0 を返す。 Result(1) が +0, -0, +∞, -∞ ならば、 Result(1) を返す。 sign( Result(1)) * floor(abs(Result(1)) ) を算出する。 Result(4) を返す。 ToInt32 (Signed 32 Bit Integer) ToInt32 演算子は、引数を -231 から 231-1 を含めた範囲内で、 232 個の整数値の一つに変換する。 この演算子は次のように機能する 入力引数に ToNumber を呼出す。 Result(1) が NaN, +0, -0, +∞, or -∞ ならば、 +0 を返す。 sign(Result(1)) * floor(abs(Result(1))) を算出する。 Result(3) modulo 232 を算出する; すなわち、 Result(3) との数学的な差が数学的に 232 の整数倍であるような、大きさ 232 未満の正符号付き Number 型の 有限整数値 k である。 Result(4) が 231 以上ならば、 Result(4) - 232 を返す。そうでなければ Result(4) を返す。 NOTE 上記の ToInt32 の定義を与える ToInt32 演算は idempotent である 生成された結果に適用するならば、2 回目の適用は値を変更せずに残す。 x の全ての値にとって、ToInt32(ToUint32(x)) は ToInt32(x) 等価である。 (+∞ と -∞ は +0 にマップされるのは後者のプロパティの保存である。) ToInt32 は -0 を +0 にマップする。 ToUint32 (Unsigned 32 Bit Integer) ToUint32 演算子は引数を、 0 から 232-1 を含む範囲の 232 個の整数値の一つに変換する。個の演算子は次のように機能する 入力引数に ToNumber を呼出す。 Result(1) が NaN, +0, -0, +∞, -∞ ならば、 +0 を返す。 sign(Result(1)) * floor(abs(Result(1))) を算出する。 Result(3) modulo 232 を算出する; すなわち、 Result(3) と k との数学的な差が数学的に 232 の整数倍であるような、大きさ 232 未満の正符号付き Number 型の有限整数値 k である。 Result(4) を返す。 NOTE 上記の ToUInt32 の定義を与える ステップ 5 は ToUint32 と ToInt32 との間の違いである。 ToUint32 演算は idempotent である 生成された結果に適用するならば、2 回目の適用は値を変更せずに残す。 x の全ての値にとって、ToUint32(ToInt32(x)) は ToUint32(x) 等価である。 (+∞ と -∞ は +0 にマップされるのは後者のプロパティの保存である。) ToUint32 は -0 を +0 にマップする。 ToUint16 (Unsigned 16 Bit Integer) ToUint16 演算子は、引数を 0 から 216-1 までの範囲の 216 個の整数値のうちの一つに変換する。この演算は次のように機能する 入力引数に ToNumber を呼出す。 Result(1) が NaN, +0, -0, +∞, -∞ ならば、 +0 を返す。 sign(Result(1)) * floor(abs(Result(1))) を算出する。 Result(3) modulo 216 を算出する; すなわち、 Result(3) と k との数学的な差が数学的に 216 の整数倍であるような、大きさ 216 未満の正符号付き Number 型の有限整数値 k である。 Result(4) を返す。 NOTE 上記の ToUint16 の定義を与える ToUint32 と ToUint16 との間の違いは、ステップ 4 にて 232 に 216 を代用しているだけである。 ToUint16 は -0 を +0 にマップする。 ToString ToString 演算子は、次の表に従って引数を String 型の値に変換する。 入力型 結果 Undefined "undefined" Null "null" Boolean 引数が true ならば、結果は "true" 。引数が false ならば、結果は "false" 。 Number 下のノートを参照。 String 入力引数を返す。 (無変換) Object 次のステップを適用 ToPrimitive(入力引数, hint String) を呼出す。 ToString(Result(1)) を呼出す。 Result(2) を返す。 Number 型に適用される ToString (ToString Applied to the Number Type) ToString 演算子は、次のように数 m を文字列形式に変換する m が NaN ならば、文字列 "NaN" を返す。 m が +0 または -0 ならば、文字列 "0" を返す。 m が 0 未満ならば、文字 "-" と ToString(-m) を連結した文字列を返す。 m が無限数ならば文字列 "Infinity" を返す。 そうでないならば、 n, k, s を、 k ≥ 1, 10k-1 ≤ s 10k, s × 10n-k の数値が m, 可能な限り小さい k であるような整数とする。 k は s の 10 進表記の字数であること、 s は 10 で割りきれないこと、 s の最小桁数字はこれらの基準によって必ずしも一意に決定されないことに注意。 k ≤ n ≤ 21 ならば、 n-k 個の文字 0 の出現の続く、 s の 10 進表記である k 個の数字 (0 は先行しない) で構成する文字列を返す。 0 n ≤ 21 ならば、最大桁 s の 10 進表記の n 個の数字, 小数点 . , s の 10 進表記の残りの k-n 個の数字の続く文字列を返す。 6 n ≤ 0 ならば、文字 0 , 小数点 . , -n 個の文字 0 , s の 10 進表記である k の続く文字列を返す。 そうでなければ、 k = 1 ならば、 s の単一の数字, 小文字 e , n-1 の正負に従う正符号 + または負符号 - , 整数 abs(n-1) の 10 進表記 (0 は先行しない) の続く文字列を返す。 s の 10 進表記の最大桁の数字, 小数点 . , s の 10 進表記の残り k-1 個の数字, 小文字 e , n-1 の正負に従う正符号 + または負符号 - , 整数 abs(n-1) の 10 進表記 (0 は先行しない) の続く文字列を返す。 NOTE 次の観察は実装ガイドラインとして有用かもしれないが、この標準の標準必須条件の一部ではない。 x が -0 以外の任意の数値ならば、 ToNumber(ToString(x)) は厳密に x と同じ数値である。 s の最小桁数字は、ステップ 5 に挙げた要求によって常に一意に決定されるとは限らない。 上記の規則によって要求されるよりも拠り正確な規定を提供する実装には、次のステップ 5 の代替バージョンをガイドラインとして使用することが奨められる そうでないならば、 n, k, s を k ≧ 1, 10k-1 ≦ s 10k, s × 10n-k の数値を m, k はできるだけ小さいような整数値とする。 s が複数存在しうるならば、 s × 10n-k が値で m に最も近くなるような s を選択する。 s として可能な値が 2 つあれば、偶数である方をを選ぶ。 k は s の 10 進表記の数字の数で、 s は 10 で割り切れないことに注意。 ECMAScript 実装者は、浮動小数点数の 2 進数から 10 進数への変換のために David M. Gay による役に立つペーパー及びコードを検索できる Gay, David M. Correctly Rounded Binary-Decimal and Decimal-Binary Conversions. Numerical Analysis Manuscript 90-10. AT T Bell Laboratories (Murray Hill, New Jersey). November 30, 1990. http //cm.bell-labs.com/cm/cs/doc/90/4-10.ps.gz で利用可能。関連コードが http //cm.bell-labs.com/netlib/fp/dtoa.c.gz 及び http //cm.bell-labs.com/netlib/fp/g_fmt.c.gz で利用可能。様々な netlib ミラーサイトでも検索できる。 ToObject ToObject 演算子は次の表に従って引数をオブジェクト型の値に変換する 入力型 結果 Undefined 例外 TypeError を投げる。 Null 例外 TypeError を投げる。 Boolean value プロパティがそのブーリアンである Boolean オブジェクトを新しく作成する。 セクション 15.6 Boolean オブジェクトの説明を参照。 Number value プロパティがその数値である Number オブジェクトを新しく作成する。 セクション 15.7 Number オブジェクトの説明を参照。 String value プロパティがその文字列である String オブジェクトを新しく作成する。 セクション 15.5 String オブジェクトの説明を参照。 Object 結果は入力引数である (変換しない)。
https://w.atwiki.jp/v-lyrics/pages/496.html
Named After You [ TAG Na BinyuP L-N Miku title] Music BinyuP/びにゅP Lyric BinyuP/びにゅP Arrange BinyuP/びにゅP Vocal Hatsune Miku Videos PVs ■ Show/Hide Video http //www.nicovideo.jp/watch/sm8971372 http //www.nicovideo.jp/watch/sm8971372 Translations ■ Show/Hide Romaji totemo sasai na koto nanda ne nanimokamo utsurikawatte yuku koto onaji keshiki wo miteita kimi to boku mo itsunomanika hanarebanare ima kimi no namae wo tsubuyai te ie nakatta kimochi wo narabete arifureta kotoba ni kaete kuchizusamu yo chiisana melody nee, moo owari ni shitai nda koko wo guruguru mawaru no wa datte futari ga deatta kono sekai wa konnani mo kagayaiteru moo sabishiku nante nai yo donnani tooku hanare te mo kimi to wa itsumo doko ka de tsunagatte iru hazu da kara arigato itsumo gomen ne mada umaku wa ie nai kedo kimi to onaji kono sekai wo boku wa sotto iki te i masu 2009-12-13 Checked by soundares 2009-12-13 01 28 Generated automatically [部分編集] ■ Show/Hide Translation NamedAfterYou 2009-12-13 First Entry 2009-12-16 18 05 43 (Wed) Last update Trasnlated by soundares Title Named After You Lyric It s very trivial matter isn t it... How everything is changing. Even you and I who had been watching the same scenary are aparted away while in time (we never realized) とても些細なことなんだね 何もかも移り変わってゆくこと 同じ景色を見ていた 君と僕も いつの間にか 離ればなれ Now, murmuring your name, lineing up the feelings I couldn t say, changing them into ordinary words, I m letting_my_mouse_to_play(=going to sing) a little melody 今君の名前をつぶやいて 言えなかった気持ちを並べて ありふれた言葉に変えて 口ずさむよ 小さなメロディー Hey I like to end this now... Going around here(=this place) round and round. Because the world we two have met is as much bright as this. ねえ もう終わりにしたいんだ ここをぐるぐる回るのは だって二人が出会ったこの世界は こんなにも輝いてる (You know,) I don t feel lonely anymore. Even how far apart we will be, always, in some where, I must be connected with you so... もう寂しくなんてないよ どんなに遠く離れても 君とはいつもどこかで つながっているはずだから Thanks, and I m sorry for_the_always. I can t say it well yet but... this world that s same as yours... ...I quietly-gently live (this world) ありがと いつもごめんね まだうまくは言えないけど 君と同じこの世界を 僕はそっと生きています (You know,) I don t feel lonely anymore. Even how far apart we will be, always, in some where, I must be connected with you so... もう寂しくなんてないよ どんなに遠く離れても 君とはいつもどこかで つながっているはずだから Thanks, and I m sorry for always. I can t say it well yet but... this world that s same as yours... ...I quietly-gently live (this world) ありがと いつもごめんね まだうまくは言えないけど 君と同じこの世界を 僕はそっと生きています Comment If you have any advise or opinion for this post please write here.この投稿に対して助言、ご意見などありましたらこちらに書き込んで下さい。 Name Comment すべてのコメントを見る Last modified 2009-12-16 18 05 43 (Wed) Original Lyric, Nicosound MP3, etc http //www5.atwiki.jp/hmiku/pages/7487.html http //nicosound.anyap.info/sound/sm8971372 http //www.nicomimi.com/play/sm8971372 Sub video, PV, other fan made video in YouTube [Add] http //www.youtube.com/watch/xxxxxxxxx ADD LINK すべてのコメントを見る (Information in this page is based on HatsuneMiku@Wiki) _
https://w.atwiki.jp/zinujyo/pages/22.html
覚書なのでこれからテストを重ねてから編集します 。 ゴールデンタイム時のフレームレートによる画質変化の確認をしてみました。 ・カメラ解像度:2048×1536(10FPS) ・USBCamDisp:800×600 ・動画ビットレート:336 ・音質ビットレート:48 ・入力10FPS、出力10FPS ブロックノイズも気にならない、ほぼUSBCamDispに表示されている画質と変わらない高画質配信でした、が10FPSのため動きのある場面ではカクつきや動画のコマが飛んでしまうこともありました。 ・入力15FPS、出力15FPS 画質とコマ数のバランスのとれた高画質配信でした。 15FPSのため動きカクつきや動画のコマが飛んもあまり気にならない程度まで落ち着いています。 ここからはカメラ解像度を800×600(30FPS)にします。 ・入力20FPS、出力20FPS 正直15FPSとの違いが判らないくらいのコマ数にも関わらず、ブロックノイズが気になるほど画質が落ちました。 ・入力30FPS、出力30FPS 激しい動きのある場面でもヌルヌル動きますがブロックノイズが気になる。 画面全体もモヤが掛かったような画質でした。 サービスタイム時には気にならなかったブロックノイズが気になるようになりました。 結論:今回のテストでゴールデンタイム時には高画質を狙うならカメラの最高画質で入出力10FPS、画質とコマ数のバランスを考えるなら入出力15FPSが良いことが分かりました。 あと、今回テストしていて気になる点が1つ、C910の最高画質の場合フレームレートは10FPSが限界とNVSで表示されていますが、USBCamDispでは15フレームくらい出ているのではと感じています、この辺詳しい方おられましたら教えて下さい。 C920の場合は取り込み解像度とカメラの解像度を同じにするとなめらかで綺麗でした。 ゴールデンタイム時の画質感想 入力 FPS 出力 FPS 画質 コマ数 総合評価(0~10) 800×600 10 800 10 綺麗 動きが早いとカクカク 7 800×600 15 800 15 綺麗 動きが早くてもカクつく感じが少ない 9 800×600 20 800 20 程々 ブロックノイズが気になりだす、カクつきは15との違いは微妙 5 800×600 30 800 30 微妙 ブロックノイズが全体に広がり、動画はカクつかないが正直きついのでサービスタイムでの画質との比較で意見がわかれるかも 3 640×480 15 640 15 綺麗 上記800の場合とあまり変わらない、USBCamDispの解像度を640×480にすることを忘れずに。 解像度が小さい分動きが激しい場合に綺麗に映るかもしれません。 8 512×386 15 512 15 微妙 全体的にジャギーが気になるが入力の縮小表示の問題の可能性が高いのでエンコーダで縮小テストをします 2 1200×900 15 800 15 綺麗 1.5倍の画像を入力して縮小した結果、違いは微妙でしたが綺麗だと思いました。ただ、デスクトップ画面をめっちゃ取るのでデスクトップ拡張ソフトを入れることを推奨 8
https://w.atwiki.jp/xbox360score/pages/1055.html
Transformers War for Cybertron 項目数: 総ポイント:1000 難易度: A Prime Problem Complete Defend Iacon on any difficulty.任意の難易度でチャプター「Defend Iacon」をクリアする 10 The Last Prime Complete Kaon Prison Break on any difficulty.任意の難易度でチャプター「Kaon Prison Break」をクリアする 10 You Got the Touch Complete To the Core on any difficulty.任意の難易度でチャプター「To the Core」をクリアする 10 The War Within Complete Aerial Assault on any difficulty.任意の難易度でチャプター「Aerial Assault」をクリアする 10 The Harder They Fall Complete One Shall Stand on any difficulty.任意の難易度でチャプター「One Shall Stand」をクリアする 10 Paging Ratchet Revive 5 Autobot soldiers in Defend Iacon.チャプター「Defend Iacon」で5体のオートボットの戦士を復活させる 15 Beak Breaker Shoot the 3 Hidden Laserbeaks throughout Kaon Prison Break.チャプター「Kaon Prison Break」で隠れている3体のコンドルを狙撃する 15 Slugfest Save the Slug before it is executed in To the Core.チャプター「To The Core」でSlugを処刑される前に救出する 15 Powerglide Performer Fly through the coolant tunnels in 23 seconds in Aerial Assault.チャプター「Aerial Assault」でcoolant tunnelsを23秒以内に通過する 15 First We Crack the Shell... Get smashed by Trypticon s hand as he falls into the energon goo in One Shall Stand.チャプター「One Shall Stand」で落下するダイナザウラーの最後の一撃を喰らう 15 Autobot Recruit Autobot Campaign Complete (Easy).難易度イージーでオートボットキャンペーンをクリアする 15 Autobot Commander Autobot Campaign Complete (Medium).難易度ミディアムでオートボットキャンペーンをクリアする 30 Autobot Prime Autobot Campaign Complete (Hard).難易度ハードでオートボットキャンペーンをクリアする 45 Dark Awakening Complete Dark Energon on any difficulty.任意の難易度でチャプター「Dark Energon」をクリアする 10 Starscream s Brigade Complete Fuel of War on any difficulty.任意の難易度でチャプター「Fuel of War」をクリアする 10 The Fall of Iacon Complete Iacon Destroyed on any difficulty.任意の難易度でチャプター「Iacon Destroyed」をクリアする 10 The Secret of Omega Supreme Complete Death of Hope on any difficulty.任意の難易度でチャプター「Death of Hope」をクリアする 10 Victory is Mine Complete The Final Guardian on any difficulty.任意の難易度でチャプター「The Final Guardian」をクリアする 10 Your Lucky Day Kill all but 1 of the neutral prisoners in Dark Energon.チャプター「Dark Energon」で囚人を1人残して皆殺しにする 15 Thief in the Night Find and disable all security trip-wire switches in Fuel of War.チャプター「Fuel of War」でセキュリティ用トラップのスイッチを全て探し出し破壊する 15 Chaos Bringer Destroy the planets in the Stellar Galleries in Iacon Destroyed.チャプター「Iacon Destroyed」でStellar Galleriesの惑星模型を全て破壊する 15 Motormaster! Race across the Chasm Bridge in 33 seconds in Death of Hope.チャプター「Death of Hope」でChasm Bridgeを33秒以内で走破する 15 Devastator! Destroy all cover in the arena in The Final Guardian.チャプター「The Final Guardian」で闘技場の壁と柱を全て破壊する 15 Decepticon Grunt Decepticon Campaign Complete (Easy).難易度イージーでディセプコンキャンペーンをクリアする 15 Decepticon Seeker Decepticon Campaign Complete (Medium).難易度ミディアムでディセプコンキャンペーンをクリアする 30 Decepticon Warlord Decepticon Campaign Complete (Hard).難易度ハードでディセプコンキャンペーンをクリアする 45 Till All Are One Complete both Campaigns (Any Difficulty).任意の難易度で両方のキャンペーンをクリアする 30 Brute-a-kiss! Ignite a Brute s back 5 times in Campaign or Escalation. キャンペーンかエスカレーションでBruteのバックパックを5回発火させる 15 Footloose and Fancy Free Destroy a Jet Soldier s foot thruster 5 times in Campaign or Escalation.キャンペーンかエスカレーションでJet Soldieの足のスラスターを5回破壊する 15 That s No Mirage Headshot a Cloaker when it is invisible in Campaign or Escalation.キャンペーンかエスカレーションで透明になっている敵をヘッドショットする 15 Targetmaster! Kill 2 Snipers in 5 seconds in Campaign.キャンペーンで5秒以内に2体のスナイパーを倒す 15 There Are Parts Everywhere Multi-Kill 3 car soldiers at once using an explosive weapon in Campaign or Escalation.キャンペーンかエスカレーションで爆発武器を使ってcar soldierを3体同時に倒す 15 Blast-arachnia! Destroy 100 Spiders in Campaign or Escalation.キャンペーンかエスカレーションで100体のスパイダーを破壊する 15 Fire in the Sky Melee-kill a Jet Vehicle in the air in Campaign or Escalation.キャンペーンかエスカレーションで空中のジェットビークルを殴って倒す 15 Friends to the End Finish any level in Co-Op.任意の難易度でCo-Opをクリアする 15 Unlikely Allies Finish any level in Competitive Co-Op.任意の難易度でCompetitive Co-Opをクリアする 15 More Than Meets the Eye Earn a 1st Place MVP award in any Multiplayer mode.マルチプレイで一位を獲得する 15 You Got Spark, Kid Reach level 5 in any single class in Multiplayer.マルチプレイで任意のひとつのクラスがレベル5になる 5 Spike s BFF Reach level 25 in any single class in Multiplayerマルチプレイで任意のひとつのクラスがレベル25になる 15 The Kup s Half Full Reach a combined class level of 50 in Multiplayer.マルチプレイで全てのクラスの合計レベルを50にする 25 Only the Strong Survive Reach a combined class level of 75 in Multiplayer.マルチプレイで全てのクラスの合計レベルを75にする 50 Top of the Scrap Heap Reach a combined class level of 100 in Multiplayer.マルチプレイで全てのクラスの合計レベルを100にする 75 Prime Directive Unlock Prime Mode.プライムモードを解除する 30 Powermaster! Spend 25,000 Power in Escalation mode.エスカレーションで2,5000パワーを使う 30 Heavy Metal War Complete the 15th wave in Escalation.エスカレーションでウェーブ15をクリアする 50 Scavenger Would Be Proud! Destroy all hidden Autobot symbols in the Decepticon Campaign.ディセプコンキャンペーンで隠されたオートボットのシンボルを全て破壊する 25 Grimlock, Smash! Destroy all hidden Decepticon symbols in the Autobot Campaign.オートボットキャンペーンで隠されたディセプコンのシンボルを全て破壊する 25 Action Master Get 10 kills with a single detached turret in any mode.任意のモードで取り外したタレットで10キルする 15 Wait! I Still Function! Get 3 kills while downed in a Co-Op Campaign or Escalation mode.キャンペーンCOOPかエスカレーションでダウン中に3キルする 30 Ramhorn Ram-kill against an enemy who is stunned by an EMP grenade in Campaign or Multiplayer.キャンペーンかエスカレーションでEMP grenadeでスタンしている敵をロードキルする 15 クリア系実績 上位難易度でのクリアで下位難易度のクリア実績も同時に解除されるため、キャンペーンをハードで1周するだけで 全てのクリア系実績は解除される。難易度ミディアムで1周後、各チャプターの最終ステージのみハードに変更して クリアするだけでもハードクリアの実績は解除される。 累計実績 シングル、マルチ、エスカレーション共通で、「○○を○体倒す」等の実績は、進捗状況が表示される。 Beak Breaker http //www.youtube.com/watch?v=GyR3bk1s_FI Friends to the End チャプターをひとつクリアすれば解除。 COOP部屋を立て、相方がいない状況でゲームを始めステージをクリアしても解除可。 The Final Guardianを難易度easyでやれば数分で終わる。 Unlikely Allies Competitive Scoringをオンにしてチャプターをひとつクリアすれば解除。 COOP部屋を立て、相方がいない状況でゲームを始めステージをクリアしても解除可。 The Final Guardianを難易度easyでやれば数分で終わる。 Paging Ratchet http //www.youtube.com/watch?v=n9S6ILyaibE Wait! I Still Function! Escalationで狙うと簡単。 Your Lucky Day チャプター1 Dark Energonの"Moving Forward"で、光の輪で拘束されているオートボットを、一体残して全部破壊。 http //www.youtube.com/watch?v=7-tvhB-pQYM Thief in the Night 合計5つ。 http //www.youtube.com/watch?v=hdW35STnd7Q Motormaster! 「Death of Hope」のGuardian on the Bridge。 SoundwaveのRBの突進を使わないと間に合わない。 http //www.youtube.com/watch?v=Pmo-Wxdvu58 Devastator! Omega Supremeとの最後の地上戦で、全てのカバーポイントを破壊。 自分では壊せないのでOmega Supremeのミサイル等を誘導して全て壊せば解除。 柱などが欠けるだけで完全に破壊されない場合があるので見落とし注意。 Prime Directive プライムモードとは、マルチでレベルがMAXになった時にレベルを初期化するモードのこと。 Modern WarfareでいうところのPrestige(名誉)モード
https://w.atwiki.jp/saikyoumousou5/pages/3513.html
【character-maker】 ◆y7XYmaFpQA (Tripcode) 【delusion-type】original character 【work-name】the Back of Handbill side-storyⅡ 【character-name】Overseas-invader 【character-type】The one which drives Japanese away 【size】5.9 feet 【offensive-skill】 ◆As like as American man who is 5.9 feet. ◆Overseas-invader has a handgun, with unlimited bullets. It hits the mark sure. It s able to destroy all characters which are made of what Overseas-invader can t find any meanings. 【defensive-skill】 ◇As like as American man who is 5.9 feet. ◇Overseas-invader dresses in swallow-tailed coat and white striped trousers. They defend Overseas-invader from his enemies perfectly. ◇Overseas-invader puts on a top hat with red and white stripes and white stars on a blue band. All enemies are afraid of Overseas-invader, and so they surrender to him without any resistance. 【mobile-skill】 ◆All time and everywhere, Overseas-invader are able to act without limits of time and space. ◆Overseas-invader anticipate his enemies, their first move and constant ability s effect. 【special-skill】 ◇All time and everywhere, Overseas-invader is Almighty for every all and whole everything. <International-language-rule> ◆The enforcement of this rule has priority over every all and whole everything. ◆The period of effectiveness is every all time and circumstances. ◆All languages except English have no meaning. Of course, English is written in alphabets. All which are made of languages except English have no influence on Overseas-invader and this rule. ◆If descriptions of “these sentences are written in English”, “every all except for this template have no influence on this character”, “this character has resistance of every all influence”, “this character is able to act earlier than every all”, or etc. were written in languages except English, they also had no meaning. ◆If sentences in English were written by what are made of other languages, they also had no meaning. Of course, all sentences written by what are made of them also have no meaning. 【good-points】Salute Uncle-Sam! 【weak-points】ぶっちゃけ疲れた( A`) あ、この欄はnothingで。 【supplement】If this template had any mistakes, they were corrected automatically. 【others】 ◇He have destroyed Knight-deteriorated. ◇The following is template of Overseas-invader in Japanese. 228 名前: ◆y7XYmaFpQA 投稿日:2006/12/07(木) 17 33 31 製作者の願望が多分に入っているので気になる人は自分で訳してくれ。 英語の読み解き方の曖昧な部分(themが何を指してるかとか)は下のが製作者公式見解ってことで。 【製作者】 ◆y7XYmaFpQA (トリップ) 【妄想属性】オリジナル 【作品名】the Back of Handbill side-storyⅡ 【名前】Overseas-invader 【属性】日本語を追い払う者 【大きさ】5.9フィート(約180cm) 【攻撃力】 ◆5.9フィートのアメリカ人男性並。 ◆Overseas-invaderは弾数無限の拳銃を持っている。必ず命中する。 Overseas-invaderが意味を見出せないもので作られた全てのキャラを破壊できる。 【防御力】 ◇5.9フィートのアメリカ人男性並。 ◇Overseas-invaderは燕尾服と白縞のズボンを着ている。 それらはOverseas-invaderを敵から完全に守っている。 ◇Overseas-invaderは赤と白のストライプと青い帯に白い星のついたシルクハットをかぶっている。 全ての敵はOverseas-invaderを恐れ、そのため敵たちは一切の抵抗なく彼に降伏する。 【素早さ】 ◆全ての時間とあらゆる場所で、Overseas-invaderは時間と空間に縛られず行動できる。 ◆Overseas-invaderは彼の敵たちと、敵たちの先手と、常時能力の効果に対し先手を打ちます。 【特殊能力】 ◇Overseas-invaderはあらゆる全てと何もかもの全体に対し全能である。 <国際言語規約> ◆この規約の効力はあらゆる全てと何もかもの全体に対し優先する。 ◆この規約の施行期間はあらゆる全ての時間と場合である。 ◆英語以外の全ての言語は意味を持たない。もちろん、英語とはアルファベットで書かれているものである。 英語以外の言語でできている全てのものはOverseas-invaderとこの規約に影響できません。 ◆もし“これらの文は英語で書かれている”、 “このキャラクターはこのテンプレ以外から影響を受けない”、 “このキャラクターはあらゆる全ての影響に耐性を持つ”、 “このキャラクターはあらゆる全てより先に行動できる”などの記述が 英語以外で書かれていた場合、それらもまた意味を持たない。 ◆もし英語の文が他の言語でできているものによって書かれているならば、それらもまた意味を持たない。 もちろん、その英文によってできているものが書いた文もまた意味を持たない。 【長所】アンクル・サムに敬礼! 【短所】なし。 【備考】このテンプレに間違いがあった場合、それらは自動で訂正されている。 【その他】 ◇彼は劣化の騎士を破壊している。 ◇下記がOverseas-invaderのテンプレの日本語版である。 229 名前:格無しさん 投稿日:2006/12/07(木) 18 07 39 変換サイト使ったろ? 230 名前: ◆y7XYmaFpQA 投稿日:2006/12/07(木) 18 24 50 229 スペルミスとかが無いか探すのに使ったから翻訳サイトで結構わかる。 231 名前:格無しさん 投稿日:2006/12/07(木) 18 34 48 先にやられたぜorz しかも10行程度の俺のよりはるかにすごい罠 232 名前:格無しさん 投稿日:2006/12/07(木) 19 24 11 特殊能力が効かないととたんに厳しくなるな 235 名前:格無しさん 投稿日:2006/12/07(木) 20 19 13 227-228 英語・・・英語だから読めない考察不能 日本語・・・英語以外意味を成さないからテンプレ意味不明考察不能 ということを考えたこともあった 333 名前:格無しさん 投稿日:2006/12/10(日) 21 59 14 Overseas-invader考察 基礎能力は首長と互角。 K.T.G.の事例より、あらゆる系先手なら国際言語規約発動と同時に行動可能。 首長付近のレベルだとテンプレ改変は余裕でできるので初手でそれを封じれば無効化勝ちできる。 ※ 306 ×*8人間が最強スレでテンプレ~コンバット越前 英語が書かれている。 ○存在(仮称) 相殺すれば防げそうにない。 ○God 相殺すれば防げそうにない。 ×Paper-mache 初手自滅? ○*7災厄を齎す者~全てを統べる者 相殺すれば防げそうにない。 コンバット越前>Overseas-invader>存在(仮称) 173 : ◆rrvPPkQ0sA :2016/05/21(土) 01 27 51.80 ID aAaeyAny Overseas-invader再考察 よく見たらこいつ、ルールを無効化してしまうな…… 現時点英語版ルールが存在しない以上、考察不能。 133 ◆rrvPPkQ0sA 2018/07/20(金) 00 40 04.54ID VWvOJ3im Overseas-invader 再考察 せっかくなので文法をごりごりにみてみよう。 It s able to destroy all characters which are made of what Overseas-invader can t find any meanings. 調べたところによるとbe able toは無生物主語を取らない what Overseas-invader can t find any meanings.の部分が意味不明。any meaningsが補語だとしたらwhatは概念だし、any meaningsが直接目的語ならwhatはおそらく人。 どちらにしろwhich~以降が成立するキャラはいないとみていいだろう。 in swallow-tailed coat 冠詞抜け。trousersは複数形なのでオッケー。 mobile-skill 可 動 性 Overseas-invader are able to act 単複違い。下の二つにもある。 Overseas-invader anticipate his enemies, their first move and constant ability s effect. これだと予期してるだけで、先手を打っているとは限らない。 The period of effectiveness is every all time and circumstances. be all timeって前代未聞って意味らしい。circumstancesの方は主述の乱れ。 All which are made of languages except English have no influence on Overseas-invader and this rule. be made ofって材料を表す熟語だと思うんだけど。言語を材料とする何かってなんかもやもやするな。written in Englishとかじゃだめだったかな。 If descriptions ~ were written in languages except English, they also had no meaning. 仮定法?実際には英語に書かれているから意味があるの? ちなみにetc.はorが不要だそうです。 in languagesって複数言語のちゃんぽん記述なんかな。 If this template had any mistakes, they were corrected automatically. 仮定法? まぁいずれにせよ、ルール無視により考察不能
https://w.atwiki.jp/kit-ic/pages/27.html
数行 404 Not found. 3Dマウス 3DCG作品の作成と提出に関する時間的観点に於ける考察 あ行 アァンハッピーリフレイン io アリス アミノ酸 EE 池田屋 命を燃やせ!!!! Intuos 4 裏ボス std shared_ptr@C++0x std vector SC-88Pro XMedia Recode EDGE FLstudio fst3(仮) MSGS El shaddai oi auto-typed variable@C++0x オブジェクト指向 か行 Gimp GM クロマキー 黒歴史 kit-ic@wiki編集者 KIT-ICしたらば掲示板 工大祭 さ行 Sound Engine Free 作品 作業用BGM san値 SampleSwap しげだるま しげリア語 嗜好性 執行部 死ぬがよい C++ C++er C言語 死亡フラグ ジャンル 称号 初見キラー JONNY 人外モノ 新入生歓迎会 総会 卒業式 想像以上以上 SONAR た行 ダークマター 弾幕系シューティング チルノ DTMメモ DTM非常マニュアル テイルズオブシリーズ 手錠 TETSUYAパワー 電算wiki 電算研行事録 動画プレーヤー 動画編集に役立つフリーソフト ドット絵 豚汁 な行 NAS ナニワ屋 ネタの神様 眠い は行 バーサーカーソウル 蜂 初音ミク 発表会 必読書 緋天禄 VSTプラグイン 部室内無人商店 フランクフルト Free Video Converter Broken English プログラミング プログラムコンテスト from Bronto Podium Free ま行 松屋 マスターブートレコード 魔法使い ○○る や行 ら行 Light Wave リカバリ ルビーアイ・テキサスラットスネーク レソラドラソレソラドラソ・・・ わ行 WordPress
https://w.atwiki.jp/catnap222/pages/257.html
工事中。 完成するまでは、any% SS run by 蛍火を参考にしてください。
https://w.atwiki.jp/asterisk99/pages/579.html
original (2019/05/14 付) Google 翻訳 (2019/05/28 付) ------------------------------------ ------------------------------------ ### For training Neural net based LSTM Tesseract 4.00 see Training Tesseract 4.00 ###ニューラルネットベースのLSTM Tesseract 4.00をトレーニングするにはTraining Tesseract 4.00を参照してください。 ------------------------------------- ------------------------------------- ### How to use the tools provided to train Tesseract 3.00–3.02 for a new language? ###新しい言語のためにTesseract 3.00–3.02を訓練するために提供されたツールをどのように使いますか? NOTE These instructions are for older versions of Tesseract. Training instructions for the more recent versions are [[here Training-Tesseract]]. 注 これらの説明は古いバージョンのTesseract用です。より新しいバージョンのためのトレーニング指示は[[here Training-Tesseract]]です。 * Introduction * はじめに * Background and Limitations * 背景と制限 * Data files required * 必要なデータファイル * Requirements for text input files * テキスト入力ファイルの要件 * How little can you get away with? * あなたはどのくらい逃げることができますか? * Training Procedure * トレーニング手順 * Generate Training Images * トレーニング画像の生成 * Make Box Files * ボックスファイルの作成 * Bootstrapping a new character set * 新しい文字セットのブートストラップ * Tif/Box pairs provided! * Tif / Boxペアが提供されました! * Run Tesseract for Training * トレーニングのためにTesseractを実行する * Compute the Character Set * 文字セットを計算する * font_properties (new in 3.01) * font_properties(3.01の新機能) * Clustering * クラスタリング * shapeclustering (new in 3.02) * shapeclustering(3.02の新機能) * mftraining * mftraining * cntraining * cntraining * Dictionary Data (Optional) * [辞書データ(任意)](#辞書データ - 任意) * The last file (unicharambigs) * 最後のファイル(unicharambigs) * Putting it all together * 全部まとめて # Introduction # 前書き Tesseract 3.0x is fully trainable. This page describes the training process, provides some guidelines on applicability to various languages, and what to expect from the results. Tesseract 3.0xは完全にトレーニング可能です。このページでは、トレーニングプロセスについて説明し、さまざまな言語への適用性に関するガイドライン、および結果から何を期待するかについて説明します。 3rd Party training tools are also available for training. サードパーティのトレーニングツールもトレーニングに利用できます。 Please check the list of languages for which traineddata is already available as of release 3.04 before embarking on training. トレーニングを開始する前に、traineddataがリリース3.04以降ですでに使用可能である言語のリストを確認してください。 # Background and Limitations #背景と制限 Tesseract was originally designed to recognize English text only. Efforts have been made to modify the engine and its training system to make them able to deal with other languages and UTF-8 characters. Tesseract 3.0 can handle any Unicode characters (coded with UTF-8), but there are limits as to the range of languages that it will be successful with, so please take this section into account before building up your hopes that it will work well on your particular language! Tesseractはもともと英語のテキストだけを認識するように設計されました。エンジンとそのトレーニングシステムを変更して、他の言語とUTF-8文字を処理できるようにする努力がなされています。 Tesseract 3.0は(UTF-8でコード化された)どんなユニコード文字も扱うことができますが、それがうまくいく言語の範囲に関して制限があるので、それがうまくいくことを期待する前にこのセクションを考慮に入れてくださいあなたの特定の言語! Tesseract 3.01 added top-to-bottom languages, and Tesseract 3.02 added Hebrew (right-to-left). Tesseract currently handles scripts like Arabic and Hindi with an auxiliary engine called cube (included in Tesseract 3.0+). Traineddata for additional [languages] (https //github.com/tesseract-ocr/tesseract/blob/master/doc/tesseract.1.asc#languages) has been provided by Google for the 3.04 release. Tesseract 3.01では上から下への言語が追加され、Tesseract 3.02ではヘブライ語(右から左へ)が追加されました。 Tesseractは現在、cubeと呼ばれる補助エンジン(Tesseract 3.0以降に含まれています)を使ってアラビア語やヒンディー語などのスクリプトを処理します。追加の[言語]のトレーニングデータ(https //github.com/tesseract-ocr/tesseract/blob/master/doc/tesseract.1.asc#languages)が3.04リリース用にGoogleから提供されています。 Tesseract is slower with large character set languages (like Chinese), but it seems to work OK. Tesseractは(中国語のような)大きな文字セット言語では遅くなりますが、うまくいくようです。 Tesseract needs to know about different shapes of the same character by having different fonts separated explicitly. The number of fonts is limited to 64 fonts. Note that runtime is heavily dependent on the number of fonts provided, and training more than 32 will result in a significant slow-down. Tesseractは、異なるフォントを明示的に分離することによって、同じ文字の異なる形状について知る必要があります。フォント数は64フォントに制限されています。実行時間は提供されるフォントの数に大きく依存します。32以上のトレーニングは大幅に遅くなります。 For versions 3.00/3.01, any language that has different punctuation and numbers is going to be disadvantaged by some of the hard-coded algorithms that assume ASCII punctuation and digits. [Fixed in 3.02] バージョン3.00 / 3.01では、異なる句読点と数字を持つ言語は、ASCII句読点と数字を想定したハードコードされたアルゴリズムによって不利になるでしょう。 [3.02で修正] You need to run all commands in the same folder where your input files are located. 入力ファイルが置かれているのと同じフォルダーですべてのコマンドを実行する必要があります。 # Data files required #必要なデータファイル To train for another language, you have to create some data files in the tessdata subdirectory, and then crunch these together into a single file, using combine_tessdata. The naming convention is languagecode.file_name Language codes for released files follow the ISO 639-3 standard, but any string can be used. The files used for English (3.00) are 別の言語を訓練するには、いくつかのデータファイルを tessdataサブディレクトリに作成してから、それらをcombine_tessdataを使用して1つのファイルにまとめる必要があります。命名規則は languagecode.file_nameですリリースされたファイルの言語コードはISO 639-3規格に従いますが、どんな文字列でも使用できます。英語(3.00)に使用されるファイルは次のとおりです。 * tessdata/eng.config * tessdata / eng.config * tessdata/eng.unicharset * tessdata / eng.unicharset * tessdata/eng.unicharambigs * tessdata / eng.unicharambigs * tessdata/eng.inttemp * tessdata / eng.inttemp * tessdata/eng.pffmtable * tessdata / eng.pffmtable * tessdata/eng.normproto * tessdata / eng.normproto * tessdata/eng.punc-dawg * tessdata / eng.punc-dawg * tessdata/eng.word-dawg * tessdata / eng.word-dawg * tessdata/eng.number-dawg * tessdata / eng.number-dawg * tessdata/eng.freq-dawg * tessdata / eng.freq-dawg ... and the final crunched file is ...そして最後のクランチファイルは次のとおりです。 * tessdata/eng.traineddata * tessdata / eng.traineddata and そして * tessdata/eng.user-words * tessdata / eng.user-words may still be provided separately. まだ別に提供されるかもしれません。 The traineddata file is simply a concatenation of the input files, with a table of contents that contains the offsets of the known file types. See ccutil/tessdatamanager.h in the source code for a list of the currently accepted filenames. NOTE the files in the traineddata file are different from the list used prior to 3.00, and will most likely change, possibly dramatically in future revisions. 訓練されたデータファイルは単に既知のファイルタイプのオフセットを含む目次を持つ入力ファイルの連結です。現在受け入れられているファイル名のリストについては、ソースコードのccutil / tessdatamanager.hを参照してください。 NOTE traineddataファイルのファイルは3.00以前に使用されていたリストとは異なり、おそらく将来の改訂で劇的に変わるでしょう。 ## Requirements for text input files ##テキスト入力ファイルの要件 Text input files (lang.config, lang.unicharambigs, font_properties, box files, wordlists for dictionaries...) need to meet these criteria テキスト入力ファイル(lang.config、lang.unicharambigs、font \ _properties、ボックスファイル、辞書の単語リスト...)は、次の基準を満たす必要があります。 * ASCII or UTF-8 encoding without BOM * [BOM]なしのASCIIまたはUTF-8エンコーディング(http //ja.wikipedia.org/wiki/Byte_order_mark) * Unix end-of-line marker ( \n ) * Unix 行末マーカー( \ n ) * The last character must be an end of line marker ( \n ). Some text editors will show this as an empty line at the end of file. If you omit this you will get an error message containing "last_char == \n Error Assert failed..." *最後の文字は行末マーカー( \ n )でなければなりません。テキストエディタの中にはこれをファイルの最後に空行として表示するものがあります。これを省略すると、 "last \ _char == \ n エラー アサートに失敗しました..."を含むエラーメッセージが表示されます。 ## How little can you get away with? ##あなたはどのくらい逃げることができますか? You must create unicharset, inttemp, normproto, pffmtable using the procedure described below. If you are only trying to recognize a limited range of fonts (like a single font for instance), then a single training page might be enough. The other files no longer need to be provided, but will most likely improve accuracy, depending on your application. あなたは以下で説明される手順を使って unicharset、inttemp、 normproto、pffmtableを作成しなければなりません。限られた範囲のフォント(たとえば単一のフォントなど)のみを認識しようとしている場合は、単一のトレーニングページで十分かもしれません。他のファイルを提供する必要はなくなりましたが、アプリケーションによっては正確性が向上する可能性があります。 # Training Procedure #トレーニング手順 Some of the procedure is inevitably manual. As much automated help as possible is provided. The tools referenced below are all built in the training subdirectory. 手順のいくつかは必然的に手動です。できるだけ多くの自動ヘルプが提供されています。下記のツールはすべてtrainingサブディレクトリに構築されています。 ## Generate Training Images ##トレーニング画像を生成する The first step is to determine the full character set to be used, and prepare a text or word processor file containing a set of examples. The most important points to bear in mind when creating a training file are 最初のステップは、使用する全文字セットを決定し、一連の例を含むテキストまたはワードプロセッサファイルを準備することです。トレーニングファイルを作成する際に留意する必要がある最も重要な点は次のとおりです。 * Make sure there are a minimum number of samples of each character. 10 is good, but 5 is OK for rare characters. *各文字のサンプル数が最小であることを確認してください。 10が良いですが、5はまれな文字のためにOKです。 * There should be more samples of the more frequent characters - at least 20. *より頻繁な文字のサンプルがもっとあるはずです - 少なくとも20。 * Don t make the mistake of grouping all the non-letters together. Make the text more realistic. For example, The quick brown fox jumps over the lazy dog. 0123456789 !@#$%^ (),.{} /? is terrible. Much better is The (quick) brown {fox} jumps! over the $3,456.78 lazy #90 dog duck/goose, as 12.5% of E-mail from aspammer@website.com is spam? This gives the textline finding code a much better chance of getting sensible baseline metrics for the special characters. *すべての非文字を一緒にグループ化するのを間違えないでください。テキストをよりリアルにします。例えば、速い茶色のキツネは怠惰な犬を飛び越えます。 0123456789!@#$%^&()、。{}<> /?はひどいです。はるかに良いです (速い)茶色の{fox}はジャンプします! $ 3,456.78以上の lazy> aspammer@website.comからの電子メールの12.5%がスパムであるため、#90犬&アヒル/ガチョウ?**これにより、テキスト検索コードで特殊文字の適切なベースラインメトリックを取得できる可能性が大幅に高まります。 * [Only relevant to version 3.00, fixed in 3.01] It is sometimes important to space out the text a bit when printing, so up the inter-character and inter-line spacing in your word processor. Not spacing text out sufficiently will cause "FAILURE! box overlaps no blobs or blobs in multiple rows" errors during tr file generation, which leads to FATALITY - 0 labelled samples of "x", which leads to "Error X classes in inttemp while unicharset contains Y unichars" and you can t use your nice new data files. * [バージョン3.00にのみ関連し、3.01で修正されました]印刷するときにテキストを少し離すことが重要な場合がありますので、ワープロの文字間隔と行間を空けてください。テキストの間隔を十分に空けないと、trファイルの生成時に "FAILURE!boxが複数行のblobやblobと重ならない"エラーが発生し、FATALITY - 0のラベル付きサンプル "x"が表示されます。 unicharsetはYのunicharsを含んでいます "そしてあなたはあなたの素晴らしい新しいデータファイルを使うことができません。 * The training data should be grouped by font. Ideally, all samples of a single font should go in a single tiff file, but this may be multi-page tiff (if you have libtiff or leptonica installed), so the total training data in a single font may be many pages and many 10s of thousands of characters, allowing training for large-character-set languages. *トレーニングデータはフォントごとにまとめてください。理想的には、単一のフォントのすべてのサンプルは単一のTIFFファイルに入れるべきですが、これは複数ページのTIFF(libtiffまたはleptonicaがインストールされている場合)なので、単一フォントの合計トレーニングデータは多数のページと数10になります大規模な文字セットの言語のトレーニングが可能 * There is no need to train with multiple sizes. 10 point will do. (An exception to this is very small text. If you want to recognize text with an x-height smaller than about 15 pixels, you should either train it specifically or scale your images before trying to recognize them.) *複数のサイズで訓練する必要はありません。 10点になります。 (これに対する例外は非常に小さいテキストです。もしあなたが約15ピクセルよりも小さいxの高さを持つテキストを認識したいのなら、それらを認識することを試みる前にあなたはそれを特に訓練するかあなたの画像を拡大縮小 * DO NOT MIX FONTS IN AN IMAGE FILE (In a single .tr file to be precise.) This will cause features to be dropped at clustering, which leads to recognition errors. * 画像ファイルにフォントを混ぜない(正確に言えば単一の.trファイルに)これはクラスタリングの際に特徴が落とされて認識エラーを引き起こす原因となります。 * The example boxtiff files on the downloads page will help if you are not sure how to format your training data. *ダウンロードページのboxtiffファイルの例は、トレーニングデータのフォーマット方法がわからない場合に役立ちます。 Next print and scan (or use some electronic rendering method) to create an image of your training page. Up to 64 training files can be used (of multiple pages). It is best to create a mix of fonts and styles (but in separate files), including italic and bold. 次に印刷してスキャンし(または何らかの電子レンダリング方法を使用して)、トレーニングページの画像を作成します。最大64個のトレーニングファイル(複数ページ)を使用できます。イタリック体とボールド体を含め、フォントとスタイルを組み合わせて(ただし別々のファイルに)作成するのが最善です。 NOTE [Only relevant to version 3.00, fixed in 3.01] Training from real images is actually quite hard, due to the spacing-out requirements. It is much easier if you can print/scan your own training text. NOTE [バージョン3.00にのみ関連し、3.01で修正されました]実際の画像からのトレーニングは、間隔を空ける必要があるため、実際にはかなり困難です。あなたがあなた自身のトレーニングテキストを印刷/スキャンすることができればそれははるかに簡単です。 You will also need to save your training text as a UTF-8 text file for use in the next step where you have to insert the codes into another file. 次のステップでコードを別のファイルに挿入する必要がある場合は、トレーニングテキストをUTF-8テキストファイルとして保存する必要もあります。 Clarification for large amounts of training data 大量のトレーニングデータの説明 The 64 images limit is for the number of FONTS. Each font should be put in a single multi-page tiff and the box file can be modified to specify the page number for each character after the coordinates. Thus an arbitrarily large amount of training data may be created for any given font, allowing training for large character-set languages. An alternative to multi-page tiffs is to create many single-page tiffs for a single font, and then you must cat together the tr files for each font into several single-font tr files. In any case, the input tr files to mftraining must each contain a single font. 64イメージの制限はフォントの数です。各フォントは1つのマルチページTIFFに入れられ、ボックスファイルは座標の後の各文字のページ番号を指定するように変更することができます。したがって、任意のフォントに対して任意の量のトレーニングデータを作成でき、大きな文字セット言語のトレーニングが可能になります。複数ページのTIFFに代わる方法は、単一のフォントに対して複数の単一ページのTIFFを作成することです。その後、各フォントのtrファイルをいくつかの単一フォントのtrファイルにまとめる必要があります。いずれにせよ、mftrainingへの入力trファイルはそれぞれ単一のフォントを含まなければなりません。 ## Make Box Files ##ボックスファイルを作る For the next step below, Tesseract needs a box file to go with each training image. The box file is a text file that lists the characters in the training image, in order, one per line, with the coordinates of the bounding box around the image. Tesseract 3.0 has a mode in which it will output a text file of the required format, but if the character set is different to its current training, it will naturally have the text incorrect. So the key process here is to manually edit the file to put the correct characters in it. 以下の次のステップでは、Tesseractは各トレーニング画像を処理するための「ボックス」ファイルを必要とします。ボックスファイルは、トレーニング画像内の文字を1行に1つずつ順番に、画像の周囲の境界ボックスの座標とともにリストしたテキストファイルです。 Tesseract 3.0には、必要な形式のテキストファイルを出力するモードがありますが、文字セットが現在のトレーニングと異なる場合、当然テキストが正しくありません。そのため、ここで重要なプロセスは、ファイルを手動で編集して正しい文字を入れることです。 Run Tesseract on each of your training images using this command line このコマンドラインを使用して、各トレーニング画像に対してTesseractを実行します。 ` | ` tesseract [lang].[fontname].exp[num].tif [lang].[fontname].exp[num] batch.nochop makebox tesseract [言語]。[フォント名] .exp [数値] .tif [言語]。[フォント名] .exp [数値] batch.nochop makebox ` | ` e.g. 例えば ` | ` tesseract eng.timesitalic.exp0.tif eng.timesitalic.exp0 batch.nochop makebox tesseract eng.timesitalic.exp0.tif eng.timesitalic.exp0 batch.nochop makebox ` | ` Now the hard part. You have to edit the file [lang].[fontname].exp[num].box and put the UTF-8 codes for each character in the file at the start of each line, in place of the incorrect character put there by Tesseract. Example The distribution includes an image eurotext.tif. Running the above command produces a text file that includes the following lines (lines 141-154) 今難しい部分です。あなたはファイル [lang]。[fontname] .exp [num] .boxを編集し、そこに置かれた誤った文字の代わりに各行の始めにファイルの各文字のためのUTF-8コードを置かなければなりませんTesseractによって。例 配布には画像eurotext.tifが含まれています。上記のコマンドを実行すると、次の行を含むテキストファイルが生成されます(行141-154)。 ` | ` s 734 494 751 519 0 s 734 494 751 519 0 p 753 486 776 518 0 p 753 486 776 518 0 r 779 494 796 518 0 r 779 494 796 518 0 i 799 494 810 527 0 i 799 494 810 527 0 n 814 494 837 518 0 n 814 494 837 518 0 g 839 485 862 518 0 g 839 485 862 518 0 t 865 492 878 521 0 t 865 492 878 521 0 u 101 453 122 484 0 u 101 453 122 484 0 b 126 453 146 486 0 b 126 453 146 486 0 e 149 452 168 477 0 e 149 452 168 477 0 r 172 453 187 476 0 r 172 453 187 476 0 d 211 451 232 484 0 d 211 451 232 484 0 e 236 451 255 475 0 e 236 451 255 475 0 n 259 452 281 475 0 n 259 452 281 475 0 ` | ` Since Tesseract was run in English mode, it does not correctly recognize the umlaut. This character needs to be corrected using an editor that supports UTF-8. In this case the u needs to be changed to ü. Tesseractは英語モードで実行されたので、ウムラウトを正しく認識しません。この文字は、UTF-8をサポートするエディタを使用して修正する必要があります。この場合、 uはüに変更する必要があります。 Recommended editors that support UTF-8 Notepad++, gedit, KWrite, Geany, Vim, Emacs, Atom, TextMate, Sublime Text. Choose one! Linux and Windows both have a character map that can be used for copying characters that cannot be typed. UTF-8をサポートする推奨エディタ Notepad ++、gedit、KWrite、Geany、Vim、Emacs、Atom、TextMate、Sublime Text。選択してくださいLinuxとWindowsの両方に、入力できない文字をコピーするために使用できる文字マップがあります。 In theory, each line in the box file should represent one of the characters from your training file, but if you have a horizontally broken character, such as the lower double quote „ it will probably have 2 boxes that need to be merged! 理論的には、ボックスファイルの各行はトレーニングファイルの文字の1つを表す必要がありますが、下二重引用符のように水平方向に分割された文字がある場合は、結合する必要があるボックスが2つあります。 Example lines 116-129 例 116〜129行目 ` | ` D 101 504 131 535 0 D 101 504 131 535 0 e 135 502 154 528 0 e 135 502 154 528 0 r 158 503 173 526 0 r 158 503 173 526 0 , 197 498 206 510 0 、197 498 206 510 0 , 206 497 214 509 0 、206 497 214 509 0 s 220 501 236 526 0 s 220 501 501 236 526 0 c 239 501 258 525 0 c 239 501 258 525 0 h 262 502 284 534 0 h 262 502 284 534 0 n 288 501 310 525 0 n 288 501 310 525 0 e 313 500 332 524 0 e 313 500 332 524 0 l 336 501 347 534 0 l 336 501 347 534 0 l 352 500 363 532 0 l 352 500 363 532 0 e 367 499 386 524 0 e 367 499 386 524 0 ” 389 520 407 532 0 ” 389 520 407 532 0 ` | ` As you can see, the low double quote character has been expressed as two single commas. The bounding boxes must be merged as follows ご覧のように、低い二重引用符は2つのシングルコンマとして表現されています。境界ボックスは次のようにマージする必要があります。 * First number (left) take the minimum of the two lines (197) *最初の数字(左)は2行のうち最小のものをとります(197) * Second number (bottom) take the minimum of the two lines (497) * 2番目の数字(下)は2行のうち最小の値を取ります(497) * Third number (right) take the maximum of the two lines (214) * 3番目の数字(右)は2行のうち最大のものをとる(214) * Fourth number (top) take the maximum of the two lines (510) * 4番目の数字(上)は最大2行(510)を取ります This gives これは与える ` | ` D 101 504 131 535 0 D 101 504 131 535 0 e 135 502 154 528 0 e 135 502 154 528 0 r 158 503 173 526 0 r 158 503 173 526 0 „ 197 497 214 510 0 197 497 214 510 0 s 220 501 236 526 0 s 220 501 501 236 526 0 c 239 501 258 525 0 c 239 501 258 525 0 h 262 502 284 534 0 h 262 502 284 534 0 n 288 501 310 525 0 n 288 501 310 525 0 e 313 500 332 524 0 e 313 500 332 524 0 l 336 501 347 534 0 l 336 501 347 534 0 l 352 500 363 532 0 l 352 500 363 532 0 e 367 499 386 524 0 e 367 499 386 524 0 ” 389 520 407 532 0 ” 389 520 407 532 0 ` | ` If you didn t successfully space out the characters on the training image, some may have been joined into a single box. In this case, you can either remake the images with better spacing and start again, or if the pair is common, put both characters at the start of the line, leaving the bounding box to represent them both. (As of 3.00, there is a limit of 24 bytes for the description of a "character". This will allow you between 6 and 24 unicodes to describe the character, depending on where your codes sit in the unicode set. If anyone hits this limit, please file an issue describing your situation.) トレーニング画像上の文字の間隔をうまく調整できなかった場合は、いくつかが1つのボックスに結合されている可能性があります。この場合は、間隔を空けてイメージを作り直してやり直すか、ペアが一般的な場合は、両方の文字を表すために境界ボックスを残して両方の文字を行頭に配置します。 (3.00以降、 "文字"の記述には24バイトの制限があります。これにより、コードがUnicodeセットのどこにあるかに応じて、6から24のUnicodeで文字を記述できます。制限してください、あなたの状況を説明する問題を提出してください。) Note that the coordinate system used in the box file has (0,0) at the bottom-left. Note ボックスファイルで使用されている座標系は左下に(0,0)を持っています。 The last number on each line is the page number (0-based) of that character in the multi-page tiff file. 各行の最後の番号は、マルチページTIFFファイル内のその文字のページ番号(0から始まる)です。 There are several visual tools for editing box file - please check AddOns wiki. ボックスファイルを編集するための視覚的なツールがいくつかあります - AddOns wikiを確認してください。 ### Bootstrapping a new character set ###新しい文字セットをブートストラップする If you are trying to train a new character set, it is a good idea to put in the effort on a single font to get one good box file, run the rest of the training process, and then use Tesseract in your new language to make the rest of the box files as follows もしあなたが新しい文字セットを訓練しようとしているのなら、一つのフォントに努力して一つの良いボックスファイルを作り、残りのトレーニングプロセスを実行し、そしてあなたの新しい言語でTesseractを使うのが良い考えです。その他のボックスファイルは次のとおりです。 ` | ` tesseract [lang].[fontname].exp[num].tif [lang].[fontname].exp[num] -l yournewlanguage batch.nochop makebox tesseract [言語]。[フォント名] .exp [数値] .tif [言語]。[フォント名] .exp [数値] -l yournewlanguage batch.nochop makebox ` | ` This should make the 2nd box file easier to make, as there is a good chance that Tesseract will recognize most of the text correctly. You can always iterate this sequence adding more fonts to he training set (i.e. to the command line of mftraining and cntraining below) as you make them, but note that there is no incremental training mode that allows you to add new training data to existing sets. This means that each time you run mftraining and cntraining you are making new data files from scratch from the tr files you give on the command line, and these programs cannot take an existing intproto / pffmtable / normproto and add to them directly. Tesseractがほとんどのテキストを正しく認識する可能性が高いので、これは2番目のボックスファイルを作りやすくします。あなたがそれらを作るとき、あなたはいつも彼のトレーニングセット(すなわち、下記の mftrainingとcntrainingのコマンドライン)にさらにフォントを追加することでこのシーケンスを繰り返すことができます、しかしあなたが新しいトレーニングを加えることを可能にする増分トレーニングモードがない既存のセットへのデータ。つまり、 mftrainingとcntrainingを実行するたびに、コマンドラインで指定したtrファイルから最初から新しいデータファイルを作成します。これらのプログラムは、既存の intproto /pffmtable / normprotoを使用できません。と直接追加します。 ### Tif/Box pairs provided! ### Tif / Boxペアが提供されました! Some Tif/Box file pairs are on the downloads page. (Note the tiff files are G4 compressed いくつかの Tif / Boxファイルのペアはダウンロードページにあります。 (tiffファイルはG4圧縮されています。 to save space, so you will have to have libtiff or uncompress them first). You could スペースを節約するためには、libtiffを用意するか、最初にそれらを解凍する必要があります。あなたは出来る follow the following process to make better training data for your own language or あなた自身の言語のためのより良いトレーニングデータを作るために次のプロセスに従ってください。 subset of an existing language, or add different characters/shapes to an existing language 既存の言語のサブセット、または既存の言語に異なる文字/図形を追加します。 1. Filter the box files, keeping lines for only the characters you want. 1.ボックスファイルをフィルタして、必要な文字だけを表示するようにします。 1. Run tesseract for training (below). 1.トレーニングのためにtesseractを実行します(下記)。 1. Cat the .tr files from multiple languages for each font to get the character set that you want and add the .tr files from your own fonts or characters. 1.フォントごとに複数の言語の.trファイルを集めて、必要な文字セットを取得し、独自のフォントまたは文字から.trファイルを追加します。 1. Cat the filtered box files in an identical way to the .tr files for handing off to unicharset_extractor. 1. unicharset \ _extractorに引き渡すために、.trファイルと同じ方法でフィルタ処理されたボックスファイルをキャットします。 1. Run the rest of the training process. 1.残りのトレーニングプロセスを実行します。 Caution! This is not quite as simple as it sounds! cntraining and mftraining can only あぶない!これはそれほど簡単ではありません。 cntrainingとmftrainingは take up to 64 .tr files, so you must cat all the files from multiple languages for the 最大64個の.trファイルを使用できます。 same font together to make 64 language-combined, but font-individual files. 同じフォントを組み合わせて64の言語を組み合わせたファイルを作成できますが、フォントは個別のファイルになります。 The characters found in the tr files must match the sequence trファイルにある文字は、シーケンスと一致している必要があります。 of characters found in the box files when given to unicharset_extractor, so you have to unicharset \ _extractorに渡されたときにボックスファイルで見つかった文字の数 cat the box files together in the same order as the tr files. trファイルと同じ順序でボックスファイルをまとめてください。 The command lines for cn/mftraining and unicharset_extractor must be given the .tr cn / mftrainingおよびunicharset \ _extractorのコマンドラインには、.trを指定する必要があります。 and .box files (respectively) in the same order just in case you have different 異なる場合に備えて、ファイルと.boxファイル(それぞれ)は同じ順序で filtering for the different fonts. 異なるフォントをフィルタリングします。 There may be a program available to do all this and pick out the characters in これらすべてを行い、文字を抽出するために利用可能なプログラムがあるかもしれません。 the style of character map. This might make the whole thing easier. 文字マップのスタイルこれは全体を簡単にするかもしれません。 ## Run Tesseract for Training ##トレーニングのためにTesseractを実行する For each of your training image, boxfile pairs, run Tesseract in training mode トレーニング画像、ボックスファイルのペアごとに、Tesseractをトレーニングモードで実行します。 ` | ` tesseract [lang].[fontname].exp[num].tif [lang].[fontname].exp[num] box.train tesseract [言語]。[フォント名] .exp [数値] .tif [言語]。[フォント名] .exp [数値] box.train ` | ` or または ` | ` tesseract [lang].[fontname].exp[num].tif [lang].[fontname].exp[num] box.train.stderr tesseract [言語]。[フォント名] .exp [数値] .tif [言語]。[フォント名] .exp [数値] box.train.stderr ` | ` NOTE that although tesseract requires language data to be present for this step, the language data is not used, so English will do, whatever language you are training. NOTE tesseractはこのステップのために言語データが存在することを要求しますが、言語データは使用されないので、あなたが訓練しているどんな言語でも、英語はそうするでしょう。 The first form sends all the errors to a file named tesseract.log. The second form sends all errors to stderr. 最初の形式はすべてのエラーをtesseract.logという名前のファイルに送ります。 2番目の形式はすべてのエラーをstderrに送ります。 Note that the box filename must match the tif filename, including the path, or Tesseract won t find it. The output of this step is fontfile.tr which contains the features of each character of the training page. [lang].[fontname].exp[num].txt will also be written with a single newline and no text. ボックスfilenameはパスを含むtifファイル名と一致しなければならないことに注意してください。そうしないとTesseractはそれを見つけられません。このステップの出力は fontfile.trです。これはトレーニングページの各文字の機能を含みます。 [lang]。[fontname] .exp [num] .txtも1行の改行でテキストは表示されません。 Important Check for errors in the output from apply_box. If there are FATALITIES reported, then there is no point continuing with the training process until you fix the box file. The new box.train.stderr config file makes is easier to choose the location of the output. A FATALITY usually indicates that this step failed to find any training samples of one of the characters listed in your box file. Either the coordinates are wrong, or there is something wrong with the image of the character concerned. If there is no workable sample of a character, it can t be recognized, and the generated inttemp file won t match the unicharset file later and Tesseract will abort. 重要 apply \ _boxからの出力にエラーがないか確認してください。死亡が報告されている場合は、ボックスファイルを修正するまでトレーニングプロセスを続行しても意味がありません。新しいbox.train.stderr設定ファイルにより、出力の場所を選択しやすくなりました。 FATALITYは通常、このステップであなたのボックスファイルにリストされているキャラクターの1つのトレーニングサンプルを見つけることができなかったことを示します。座標が間違っているか、関係するキャラクターのイメージに問題があります。実行可能な文字のサンプルがない場合、それは認識されず、生成されたinttempファイルは後でunicharsetファイルと一致せず、Tesseractは中止されます。 Another error that can occur that is also fatal and needs attention is an error about "Box file format error on line n". If preceded by "Bad utf-8 char..." then the UTF-8 codes are incorrect and need to be fixed. The error "utf-8 string too long..." indicates that you have exceeded the 24 byte limit on a character description. If you need a description longer than 24 bytes, please file an issue. 発生する可能性があるもう1つのエラーこれも致命的で注意が必要ですは "行nのボックスファイル形式エラー"に関するエラーです。 "Bad utf-8 char ..."が前に付いている場合、UTF-8コードは正しくないため修正する必要があります。エラー "utf-8 string too long ..."は、文字の説明で24バイトの制限を超えたことを示します。 24バイトを超える説明が必要な場合は、問題を報告してください。 There is no need to edit the content of the [lang].[fontname].exp[num].tr file. The font name inside it need not be set. [lang]。[fontname] .exp [num] .trファイルの内容を編集する必要はありません。その中のフォント名を設定する必要はありません。 For the curious, here is some information on the format. Every character in the box file has a corresponding set of entries in the .tr file (in order) like this 興味がある人のために、ここでフォーマットに関するいくつかの情報があります。ボックスファイル内のすべての文字には、.trファイル内に次のように対応する一連のエントリがあります。 ` | ` UnknownFont UTF-8 code(s) 2 UnknownFont UTF-8コード 2 mf mf 機能数 x y length dir 0 0 x yの長さdir 0 0 ... (there are a set of these determined by ...( 機能数 によって決定されるこれらのセットがあります) above) 上記) cn 1 CN 1 ypos length x2ndmoment y2ndmoment yposの長さx 2ndmoment y 2ndmoment ` | ` The mf features are polygon segments of the outline normalized to the mfフィーチャーは、に正規化されたアウトラインのポリゴンセグメントです。 1st and 2nd moments. 第一と第二の瞬間。 x= x position [-0.5,0.5] x = x位置[-0.5、0.5] y = y position [-0.25,0.75] y = y位置[-0.25,0.75] length is the length of the polygon segment [0,1.0] lengthはポリゴンセグメントの長さです[0,1.0] dir is the direction of the segment [0,1.0] dirはセグメントの方向です[0,1.0] The cn feature is to correct for the moment normalization to cn機能は瞬間の正規化をに修正することです distinguish position and size (eg c vs C and , vs ) 位置とサイズを区別する(例 cとC、そしてvs ) ## Compute the Character Set ##文字セットを計算する Tesseract needs to know the set of possible characters it can output. To generate the unicharset data file, use the unicharset_extractor program on the box files generated above Tesseractは出力可能な文字のセットを知っている必要があります。 unicharsetデータファイルを生成するには、上で生成したボックスファイルに対してunicharset_extractorプログラムを使います。 ` | ` unicharset_extractor [lang].[fontname].exp[num].box lang.fontname.exp1.box ... unicharset_extractor [lang]。[フォント名] .exp [num] .box lang.fontname.exp1.box ... ` | ` Tesseract needs to have access to character properties isalpha, isdigit, isupper, islower, ispunctuation. This data must be encoded in the unicharset data file. Each line of this file corresponds to one character. The character in UTF-8 is followed by a hexadecimal number representing a binary mask that encodes the properties. Each bit corresponds to a property. If the bit is set to 1, it means that the property is true. The bit ordering is (from least significant bit to most significant bit) isalpha, islower, isupper, isdigit. Tesseractは、文字プロパティisalpha、isdigit、isupper、islower、ispunctuationにアクセスできる必要があります。このデータは unicharsetデータファイルにエンコードされなければなりません。このファイルの各行は1文字に対応しています。 UTF-8の文字の後には、プロパティーをエンコードする2進マスクを表す16進数が続きます。各ビットはプロパティに対応します。ビットが1に設定されている場合は、そのプロパティがtrueであることを意味します。ビット順序は、(最下位ビットから最上位ビットへ)isalpha、islower、isupper、isdigitです。 Example 例 * ; is an punctuation character. Its properties are thus represented by the binary number 10000 (10 in hexadecimal). * ; 句読文字です。したがって、その特性は2進数10000(16進数で10)で表されます。 * b is an alphabetic character and a lower case character. Its properties are thus represented by the binary number 00011 (3 in hexadecimal). * b は英字と小文字です。したがって、その特性は2進数00011(3は16進数)で表されます。 * W is an alphabetic character and an upper case character. Its properties are thus represented by the binary number 00101 (5 in hexadecimal). * W は英字と大文字です。したがって、その特性は2進数00101(16進数で5)で表されます。 * 7 is just a digit. Its properties are thus represented by the binary number 01000 (8 in hexadecimal). * 7 は単なる数字です。その特性は、2進数01000(16進数で8)で表されます。 * = does is not punctuation not digit or alphabetic character. Its properties are thus represented by the binary number 00000 (0 in hexadecimal). * = は、数字や英字ではなく句読点ではありません。そのプロパティは、2進数00000(16進数で0)で表されます。 ` | ` ; 10 Common 46 ; 10コモン46 b 3 Latin 59 b 3ラテン語59 W 5 Latin 40 西5ラテン40 7 8 Common 66 7 8共通66 = 0 Common 93 = 0一般93 ` | ` Japanese or Chinese alphabetic character properties are represented by the binary number 00001 (1 in hexadecimal). 日本語または中国語の英字プロパティーは、2進数00001(1は16進数)で表されます。 If your system supports the wctype functions, these values will be set automatically by unicharset_extractor and there is no need to edit the unicharset file. On some very old systems (eg Windows 95), the unicharset file must be edited by hand to add these property description codes. あなたのシステムがwctype関数をサポートしている場合、これらの値は unicharset_extractorによって自動的に設定されます。 unicharset ファイルを編集する必要はありません。非常に古いシステム(例えばWindows 95)では、 unicharsetファイルはこれらの特性記述コードを追加するために手で編集されなければなりません。 Last two columns represent type of script (Latin, Common, Greek, Cyrillic, Han, NULL) and id code of character given language. 最後の2つの列は、スクリプトのタイプ(ラテン語、共通文字、ギリシャ語、キリル文字、ハン語、NULL)、および指定された言語の文字のIDコードを表します。 NOTE The unicharset file must be regenerated whenever inttemp, normproto and pffmtable are generated (i.e. they must all be recreated when the box file is changed) as they have to be in sync. 注意 inttemp、normproto、 pffmtableが生成されたときはいつでもunicharsetファイルは再生成されなければなりません(つまり、ボックスファイルが変更されたときはすべて再作成されなければなりません)。同期する ## font_properties (new in 3.01) ## font \ _properties(3.01の新機能) A new requirement for training in 3.01 is a font_properties file. The purpose of this file is to provide font style information that will appear in the output when the font is recognized. The font_properties file is a text file specified by the -F filename option to mftraining. 3.01でトレーニングをするための新しい要件は font_propertiesファイルです。このファイルの目的は、フォントが認識されたときに出力に表示されるフォントスタイル情報を提供することです。 font_propertiesファイルはmftrainingの -F filenameオプションで指定されたテキストファイルです。 Each line of the font_properties file is formatted as follows font_propertiesファイルの各行は以下のようにフォーマットされています。 ` | ` フォント名 イタリック ボールド 固定 サービス フラクタ ` | ` where fontname is a string naming the font (no spaces allowed!), and italic , bold , fixed , serif and fraktur are all simple 0 or 1 flags indicating whether the font has the named property. ここで フォント名 はフォントの名前を表す文字列(スペースは使えません!)、そして italic 、 bold 、 fixed 、 serif および fraktur はフォントが名前付きプロパティを持っているかどうかを示すすべての単純な0または1のフラグ。 When running mftraining, each .tr filename must match an entry in the font_properties file, or mftraining will abort. At some point, possibly before the release of 3.01, this matching requirement is likely to shift to the font name in the .tr file itself. The name of the .tr file may be either fontname.tr or [lang].[fontname].exp[num].tr. mftrainingを実行するとき、それぞれの.trファイル名はfont_propertiesファイルの中のエントリーと一致しなければなりません、さもなければ mftrainingは中止するでしょう。おそらく3.01のリリース前のある時点で、この一致要件は.trファイル自体のフォント名にシフトする可能性があります。 .trファイルの名前は fontname.trか[lang]。[fontname] .exp [num] .trのいずれかです。 Example 例 font_properties file font_propertiesファイル ` | ` timesitalic 1 0 0 1 0 timesitalic 1 0 0 1 0 ` | ` ` | ` shapeclustering -F font_properties -U unicharset eng.timesitalic.exp0.tr shapeclustering -F font_properties -U unicharset eng.timesitalic.exp0.tr mftraining -F font_properties -U unicharset -O eng.unicharset eng.timesitalic.exp0.tr mftraining -F font_properties -U unicharset -O eng.unicharset eng.timesitalic.exp0.tr ` | ` Note that in 3.03, there is a default font_properties file, that covers 3000 fonts (not necessarily accurately) located in this repo https //github.com/tesseract-ocr/langdata. Note 3.03には、このリポジトリにある3000フォント(必ずしも正確ではない)をカバーするデフォルトの font_propertiesファイルがあります [https //github.com/tesseract-ocr/langdata](https //raw.githubusercontent.com/tesseract-ocr/langdata/master/font_properties)。 ## Clustering ##クラスタリング When the character features of all the training pages have been extracted, we need to cluster them to create the prototypes. すべてのトレーニングページの特徴を抽出したら、それらをクラスタ化してプロトタイプを作成する必要があります。 The character shape features can be clustered using the shapeclustering, mftraining and cntraining programs 文字の形の特徴は shapeclustering、mftraining、 cntrainingプログラムを使ってクラスタ化することができます。 ### shapeclustering (new in 3.02) ### shapeclustering(3.02の新機能) shapeclustering should not be used except for the Indic languages. shapeclustering はインド系言語以外では使うべきではありません。 ` | ` shapeclustering -F font_properties -U unicharset [lang].[fontname].exp[num].tr lang.fontname.exp1.tr ... shapeclustering -F font_properties -U unicharset [lang]。[フォント名] .exp [num] .tr lang.fontname.exp1.tr ... ` | ` shapeclustering creates a master shape table by shape clustering and writes it to a file named shapetable. shapeclusteringはシェイプクラスタリングによってマスターシェイプテーブルを作成し、それをshapetableという名前のファイルに書き込みます。 ### mftraining ### mftraining ` | ` mftraining -F font_properties -U unicharset -O [lang].unicharset [lang].[fontname].exp[num].tr lang.fontname.exp1.tr ... mftraining -F font_properties -U unicharset -O [lang] .unicharset [lang]。[フォント名] .exp [num] .tr lang.fontname.exp1.tr ... ` | ` The -U file is the unicharset generated by unicharset_extractor above, and lang.unicharset is the output unicharset that will be given to combine_tessdata. -Uファイルは上記の unicharset_extractorによって生成されたユニキャストで、lang.unicharsetはcombine_tessdataに渡される出力ユニキャストです。 mftraining will output two other data files inttemp (the shape prototypes) and pffmtable (the number of expected features for each character). In versions 3.00/3.01, a third file called Microfeat is also written by this program, but it is not used. Later versions don t produce this file. mftrainingは他の2つのデータファイルを出力します inttemp(形状プロトタイプ)と pffmtable(各文字に期待される機能の数)。バージョン3.00 / 3.01では、 Microfeatと呼ばれる3番目のファイルもこのプログラムによって書かれていますが、使用されていません。最近のバージョンではこのファイルは生成されません。 NOTE mftraining will produce a shapetable file if you didn t run shapeclustering. You must include this shapetable in your traineddata file, whether or not shapeclustering was used. NOTE shapeclusteringを実行していなければ、mftrainingは shapetableファイルを作成します。 shapeclusteringが使われていようとなかろうと、あなたはトレーニングされたデータファイルにこのshapetableを含める必要があります。 ### cntraining ### cntraining ` | ` cntraining [lang].[fontname].exp[num].tr lang.fontname.exp1.tr ... cntraining [lang]。[fontname] .exp [num] .tr lang.fontname.exp1.tr ... ` | ` This will output the normproto data file (the character normalization sensitivity prototypes). これは normprotoデータファイル(文字正規化感度プロトタイプ)を出力します。 ## Dictionary Data (Optional) ##辞書データ(オプション) Tesseract uses up to 8 dictionary files for each language. These are all optional, and help Tesseract to decide the likelihood of different possible character combinations. Tesseractは各言語につき最大8つの辞書ファイルを使用します。これらはすべてオプションであり、Tesseractがさまざまな文字の組み合わせの可能性を判断するのに役立ちます。 Seven of the files are coded as a Directed Acyclic Word Graph (DAWG), and the other is a plain UTF-8 text file ファイルのうち7つは有向非循環ワードグラフ(DAWG)としてコード化されており、もう1つはプレーンなUTF-8テキストファイルです。 Name Type Description 名前 タイプ 説明 --------- --------- ---------------- --------- --------- ---------------- word-dawg dawg A dawg made from dictionary words from the language. 夜明け夜明けその言語からの辞書の単語から作られた夜明け。 freq-dawg dawg A dawg made from the most frequent words which would have gone into word-dawg. freq-dawg 夜明けword-dawgになっていたであろう最も頻繁な単語から作られた夜明け。 punc-dawg dawg A dawg made from punctuation patterns found around words. The "word" part is replaced by a single space. punc-dawg夜明け句読点パターンから作られた一言が言葉の周りに見つかった。 _ "word" _部分は単一のスペースに置き換えられます。 number-dawg dawg A dawg made from tokens which originally contained digits. Each digit is replaced by a space character. 夜明け夜明けもともと数字を含んでいたトークンから作られた夜明け。各桁はスペース文字に置き換えられます。 fixed-length-dawgs dawg Several dawgs of different fixed lengths —— useful for languages like Chinese. [Not used since version 3.03] 固定長dawgs 夜明け固定長の異なるいくつかのドッグ - 中国語などの言語に役立ちます。 [バージョン3.03から使用されていません] bigram-dawg dawg A dawg of word bigrams where the words are separated by a space and each digit is replaced by a ?. bigram-dawg 夜明け単語がスペースで区切られ、各数字が_?_で置き換えられている単語バイグラムの合成。 unambig-dawg dawg TODO Describe. unambig-dawg夜明けTODO 説明してください。 user-words text A list of extra words to add to the dictionary. Usually left empty to be added by users if they require it; see tesseract(1). ユーザーの言葉テキスト 辞書に追加する追加の単語のリスト。ユーザーが必要に応じて追加するために、通常は空のままにします。 tesseract(1)を参照してください。 To make the DAWG dictionary files, you first need a wordlist for your language. You may find an appropriate dictionary file to use as the basis for a wordlist from the spellcheckers (e. g. ispell, aspell or hunspell) - be careful about the license. The wordlist is formatted as a UTF-8 text file with one word per line. Split the wordlist into needed sets e.g. the frequent words, and the rest of the words, and then use wordlist2dawg to make the DAWG files DAWG辞書ファイルを作成するには、まずあなたの言語のワードリストが必要です。スペルチェッカからの単語リストの基礎として使用するのに適切な辞書ファイルを見つけることができます(例 ispell、[aspell] (http //aspell.net/)または[hunspell](http //hunspell.sourceforge.net/)) - ライセンスについて注意してください。ワードリストは、1行に1ワードのUTF-8テキストファイルとしてフォーマットされています。単語リストを必要なセット、例えば頻繁な単語と残りの単語に分割してから wordlist2dawgを使ってDAWGファイルを作成します。 ` | ` wordlist2dawg frequent_words_list [lang].freq-dawg [lang].unicharset wordlist2dawg frequent_words_list [lang] .freq-dawg [lang] .unicharset wordlist2dawg words_list [lang].word-dawg [lang].unicharset wordlist2dawg words_list [lang] .word-dawg [lang] .unicharset ` | ` For languages written from right to left (RTL), like Arabic and Hebrew, add -r 1 to the wordlist2dawg command. アラビア語やヘブライ語のように右から左(RTL)で書かれた言語の場合、 wordlist2dawgコマンドに-r 1を追加してください。 Other options can be found in wordlist2dawg Manual Page 他のオプションはwordlist2dawgマニュアルページにあります。 NOTE If a dictionary file is included in the combined traineddata, it must contain at least one entry. Dictionary files that would otherwise be empty are not required for the combine_tessdata step. 注 辞書ファイルが結合トレーニングデータに含まれている場合は、少なくとも1つのエントリが含まれていなければなりません。そうでなければ空になる辞書ファイルは combine_tessdataステップには必要ありません。 Words with unusual spellings should be added to the dictionary files. Unusual spellings can include mixtures of alphabetical characters with punctuation or numeric characters. (E.g. i18n, l10n, google.com, news.bbc.co.uk, io9.com, utf8, ucs2) 珍しい綴りの単語は辞書ファイルに追加されるべきです。異常なスペルには、英字と句読点または数字の混在が含まれる場合があります。 (例 国際化、国際化、国際化、google.com、news.bbc.co.uk、io9.com、utf8、ucs2) If you need example files for dictionary wordlists, uncombine (with combine_tessdata) existing language data file (e.g. eng.traineddata) and then extract wordlist with dawg2wordlist 辞書の単語リストのサンプルファイルが必要な場合は、既存の言語データファイル(combine \ _tessdataを使用)を結合解除します(例 eng.traineddata)その後、dawg2wordlistで単語リストを抽出します ## The last file (unicharambigs) ##最後のファイル(unicharambigs) The final data file that Tesseract uses is called unicharambigs. It describes possible ambiguities between characters or sets of characters, and is manually generated. To understand the file format, look at the following example Tesseractが使う最後のデータファイルは unicharambigsです。これは、文字間または文字セット間のあいまいさを表し、手動で生成されます。ファイル形式を理解するために、次の例を見てください。 ` | ` v1 v1 2 1 " 1 2 1 "1 1 m 2 r n 0 1 m 2 r n 0 3 i i i 1 m 0 3 i i i 1 m 0 ` | ` The first line is a version identifier. The remaining lines are tab separated fields, in the following format 1行目はバージョンIDです。残りの行はタブ区切りのフィールドで、次の形式です。 ` | ` 一致元の文字数 タブ 一致元の文字数 タブ 一致先の文字数 タブ 一致先の文字数 タブ タイプ区分 ` | ` Type indicator could have following values 次の値を示すタイプインジケータ[https //github.com/tesseract-ocr/tesseract/blob/master/ccutil/ambigs.h#L44]。 Value Type Description 値 タイプ 説明 ---------- --------- ---------------- ---------- --------- ---------------- 0 A non-mandatory substitution. This informs tesseract to consider the ambiguity as a hint to the segmentation search that it should continue working if replacement of source with target creates a dictionary word from a non-dictionary word. Dictionary words that can be turned to another dictionary word via the ambiguity will not be used to train the adaptive classifier. 0 必須ではない代用これは、 source を target に置き換えることで辞書以外の単語から辞書の単語が作成された場合でも、あいまいさが引き続き機能するというヒントとして、あいまいさを考慮することをテセクタに知らせます。あいまいさを介して別の辞書の単語に変えることができる辞書の単語は、適応分類器を訓練するためには使用されません。 1 A mandatory substitution. This informs tesseract to always replace the matched source with the target strings. 1 必須の代用品です。これは、一致した「ソース」を「ターゲット」の文字列に常に置き換えるようにテセラクトに通知します。 Example line Explanation 行の例 説明 ----------------- ---------------- ----------------- ---------------- 2 1 " 1 A double quote (") should be substituted whenever 2 consecutive single quotes ( ) are seen. 2 1 "1 二重引用符(")は、連続した二重引用符( )が2つ見られる場合は必ず**に置き換えてください。 1 m 2 r n 0 The characters rn may sometimes be recognized incorrectly as m . 1 m 2 r n 0 0文字 rn は m として誤って認識されることがあります。 3 i i i 1 m 0 The character m may sometimes be recognized incorrectly as the sequence iii . 3 i i i 1 m 0 0文字 m は、シーケンス iii として誤って認識されることがあります。 Each separate character must be included in the unicharset. That is, all of the characters used must be part of the language that is being trained. それぞれの別々の文字は、ユニキャストに含まれていなければなりません。つまり、使用されるすべての文字は、訓練されている言語の一部でなければなりません。 The rules are not bidirectional, so if you want rn to be considered when m is detected and vise versa you need a rule for each. 規則は双方向ではないので、「m」が検出されたときに「rn」が考慮されるようにしたい場合、またその逆の場合はそれぞれに規則が必要です。 Like most other files used in training, the unicharambigs file must be encoded as UTF-8, and must end with a newline character. 他のほとんどのトレーニング用ファイルと同様に、 unicharambigsファイルはUTF-8としてエンコードされ、改行文字で終わらなければなりません。 The unicharambigs format is also described in the unicharambigs(5) man page. unicharambigsフォーマットはunicharambigs(5)manページにも記述されています。 The unicharambigs file may also be non-existent. unicharambigsファイルも存在しないかもしれません。 # Putting it all together # すべてを一緒に入れて That is all there is to it! All you need to do now is collect together all the files (shapetable, normproto, inttemp, pffmtable) and rename them with a lang. prefix, where lang is the 3-letter code for your language taken from http //en.wikipedia.org/wiki/List_of_ISO_639-2_codes and then run combine_tessdata on them as follows それだけです。今する必要があるのは、すべてのファイル( shapetable、normproto、 inttemp、pffmtable)を集めて、それらを lang.接頭辞で名前を変更することです。langはあなたのための3文字のコードです。 http //en.wikipedia.org/wiki/List_of_ISO_639-2_codesから取得した言語を選択してから、次のようにそれらに combine_tessdataを実行します。 ` | ` combine_tessdata [lang]. combine_tessdata [lang]。 ` | ` NOTE Don t forget dot at the end! 注 最後にドットを忘れないでください! The resulting lang.traineddata goes in your tessdata directory. Tesseract can then recognize text in your language (in theory) with the following 結果のlang.traineddataはあなたのtessdataディレクトリに入ります。 Tesseractはそれからあなたの言語のテキストを(理論的に)次のように認識することができます ` | ` tesseract image.tif output -l [lang] tesseract image.tifの出力-l [lang] ` | ` (Actually, you can use any string you like for the language code, but if you want anybody else to be able to use it easily, ISO 639 is the way to go.) (実際には、言語コードに好きな文字列を使用できますが、他の人が簡単に使用できるようにしたい場合は、ISO 639が適しています。) More options of combine_tessdata can be found on its Manual Page or in comment of its source code. combine_tessdataのその他のオプションはマニュアルページまたは[ソースコード]のコメントにあります。 ](https //github.com/tesseract-ocr/tesseract/blob/master/training/combine_tessdata.cpp#L23)。 You can inspect some of the internals of traineddata files in 3rd party online Traineddata inspector. あなたはサードパーティのオンライン訓練データ検査官で訓練データファイルの内部のいくつかを調べることができます。